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数学 图 像 处 理 (第 版 ) 


Digital Image Processing, Third [dition , 


在 数字 图 像 处 理 领域 ， 本 书 作 为 主要 教材 已 有 30 多 年 。 就 像 由 Gonzalez 和 Wintz 编 写 的 1977 年 版 和 1987 
年 版 、 由 Gonzalez 和 Woods 编 写 的 1992 年 版 和 2002 年 版 那样 ， 这 一 版 也 是 我 们 用 心 为 学 生 和 教师 准备 的 。 
基于 对 32 个 国家 的 134 所 高 校 的 教师 、 学 生 和 自学 者 的 广泛 调查 ,这 一 版 已 做 了 大 量 的 修订 与 更 新 。 新 增 内 容 
与 时 俱 进 、 可 读 性 高 ， 并 给 出 了 大 量具 有 实际 意义 的 例子 。 履 盖 的 图 像 处 理 领 域 包括 灰 度 变换 和 空间 滤波 、 
频率 域 中 的 侍 里 叶 变换 和 滤波 、 图 像 增强 、 图 像 复 原 、 计 算 机 断层 、 模 糊 集 合 、 彩 色 图 像 处 理 、 小 波 、 图 像 


和 视频 压缩 、 形 态 学 处 理 、 图 像 分 割 、 图 像 描述 、 目 标识 别 。 
相关 图 书 


n 为 使 读者 更 早 地 接触 基础 内 容 ， 对 介绍 性 概念 进行 了 修订 。 = 

a 修订 和 更 新 了 关于 灰 度 变换 、 空 间 域 相关 、 卷 积 及 它们 在 空间 滤波 中 
的 应 用 的 讨论 。 

E 新 增 子 关于 模糊 集合 及 其 在 图 像 处 理 中 的 应 用 的 讨论 。 

E 扩充 了 关于 离散 八里 叶 变 换 和 频率 域 处 理 的 内 容 。 

E 扩充 了 关于 计算 机 断层 的 内 容 。 

E 对 小 波 章节 进行 了 较 大 的 修订 。 

加 扩充 了 关于 数据 压缩 的 一 章 ， 包 括 新 的 压缩 技术 、 数 字 视 频 压 缩 、 压 
缩 标准 和 水 印 处 理 。 

加 扩充 了 关于 形态 学 重建 、 灰 度 形态 学 和 现代 形态 学 算法 的 内 容 。 

m 扩充 了 关于 Marr 一 Hildreth 边 缘 检 测算 法 和 坎 尼 边缘 检测 算法 的 内 容 。 

a 扩充 了 关于 图 像 阅 值 处 理 的 内 容 ，。 

E 给 出 了 许多 新 例子 ， 包 括 400 余 幅 新 图 像 和 200 多 幅 新 图 表 。 

加 扩充 了 习题 集 ， 包 含 了 80 多 道 新 习题 。 

a 更 新 了 参考 文献 。 


本 书 网 站 ~www.prenhall.com/gonzalezwoods 


尽管 本 书 完全 自 成 体系 ， 但 近来 全 新 改版 的 配套 网 站 为 读者 提供 了 额外 的 支持 ， 这 些 支 持 包括 所 选 习题 的 答案 、 实 验 项 目 建议 、 课 堂 演示 幻灯 片 等 。 
教师 手册 可 提供 给 采用 本 书 作为 教材 的 教师 。 
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本 书 是 关于 数字 图 像 处 理 的 经 典 著作 ,作者 在 对 32 个 国家 的 134 所 院 校 和 研究 所 的 教师 、 学 生 及 自学 者 进行 
广泛 调查 的 基础 上 编写 了 第 三 版 。 除 保留 第 二 版 的 大 部 分 主要 内 容 外 , 还 根据 收集 的 建议 从 13 个 方面 进行 了 修订 ， 
新 增 了 400 多 幅 图 像 、200 多 个 图 表 和 80 多 道 习题 ， 同 时 融入 了 近年 来 本 科学 领域 的 重要 发 展 ， 使 本 书 具 有 鲜明 
的 特色 与 时 效 性 。 全 书 共 分 12 章 , 包括 绪论 :数字 图 像 基 础 、 灰 度 变换 与 空间 滤波 、 频 域 滤 波 、 图 像 复 原 与 重建 、 
彩色 图 像 处 理 、 小 波及 多 分 辨 率 处 理 、 图 像 压缩 、 形 态 学 图 像 处 理 、 图 像 分 割 、 表 现 与 描述 、 目 标识 别 。 

本 书 适用 对 象 主要 是 从 事 信 和 号 与 信息 处 理 、 计 算 机 科学 与 技术 、 自 动 化 、 电 子 科学 与 技术 、 通 信 工 程 、 信 息 
工程 、 地 球 物理 、 生 物 工 程 、 生 物 医 学 工程 、 物 理 、 化 学 、 医 学 、 遥 感 等 领域 的 大 学 教师 和 科技 工作 者 、 研 究 生 、 
大 学 本 科 高 年 级 学 生 及 工程 技术 人 员 。 

Original edition, entitled Digital Image Processing, Third Edition, 9780132345637 by Rafael C. Gonzalez, Richard E. 
Woods, published by Pearson Education, Inc, publishing as Prentice Hall, Copyright © 2010 Pearson Education, Inc. 
All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means, electronic or 


mechanical, including photocopying, recording or by any information storage retrieval system, without permission form 
Pearson Education, Inc. 

China edition published by PEARSON EDUCATION ASIA LTD. and PUBLISHING HOUSE OF ELECTRONICS 
INDUSTRY, Copyright © 2017. 

This edition is manufactured in the People’s Republic of China, and is authorized for sale only in the mainland of China 
exclusively (except Taiwan, Hong Kong SAR and Macau SAR). 


本 书 中 文 简体 字 翻 译 版 由 Pearson Education ( 培 生 教育 出 版 集团 ) 授予 电子 工业 出 版 社 。 未 经 出 版 者 预先 书面 许可 ， 
不 得 以 任何 方式 复制 或 抄袭 本 书 的 任何 部 分 。 
本 书 封面 贴 有 Pearson Education ( 培 生 教育 出 版 集团 ) 激光 防伪 标签 ， 无 标签 者 不 得 销售 。 
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较 暗 图 像 校正 后 的 图 像 
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2001 年 7 月 间 , 电子 工业 出 版 社 的 领导 同志 邀请 各 高 校 十 几 位 通信 和 领域 方面 的 老师 ,商量 引进 国 
外 教材 问题 。 与 会 同志 对 出 版 社 提出 的 计划 十 分 赞同 ， 大 家 认为 ， 这 对 我 国 通信 事业 、 特 别 是 对 高 等 
院 校 通信 学 科 的 教学 工作 会 很 有 好 处 。 

教材 建设 是 高 校 教学 建设 的 主要 内 容 之 一 。 编 写 、 出 版 一 本 好 的 教材 ， 意 味 着 开设 了 一 门 好 的 课 
程 ， 甚 至 可 能 预示 着 一 个 胃 新 学 科 的 诞生 。20 世纪 40 年 代 MIT 林肯 实验 室 出 版 的 一 套 28 本 雷达 从 
书 ， 对 近代 电子 学 科 、 特 别 是 对 雷达 技术 的 推动 作用 ， 就 是 一 个 很 好 的 例子 。 

我 国 领导 部 门 对 教材 建设 一 直 非 常 重视 。20 世纪 80 年 代 ， 在 原 教委 教材 编审 委员 会 的 领导 下 ， 
汇集 了 高 等 院 校 几 百 位 富有 教学 经 验 的 专家 ， 编 写 、 出 版 了 一 大 批 教材 ; 很 多 院 校 还 根据 学 校 的 特点 
和 需要 ， 陆 续 编 写 了 大 量 的 讲义 和 参考 书 。 这 些 教材 对 高 校 的 教学 工作 发 挥 了 极 好 的 作用 。 近 年 来 ， 
随 着 教学 改革 不 断 深入 和 科学 技术 的 飞速 进步 ， 有 的 教材 内 容 已 比较 陈旧 、 落 后 ， 难 以 适应 教学 的 要 
求 ， 特 别 是 在 电子 学 和 通信 技术 发 展 神速 、 可 以 讲 是 日 新 月 异 的 今天 ， 如 何 适 应 这 种 情况 ， 更 是 一 个 
必须 认真 考虑 的 问题 。 解 决 这 个 问题 ， 除 了 依靠 高 校 的 老师 和 专家 撰写 新 的 符合 要 求 的 教科 书 外 ， 引 
进 和 出 版 一 些 国 外 优秀 电子 与 通信 教材 ， 尤 其 是 有 选择 地 引进 一 批 英 文 原版 教材 ， 是 会 有 好 处 的 。 

一 年 多 来 ,电子 工业 出 版 社 为 此 做 了 很 多 工作 。 他 们 成 立 了 一 个 “国外 电子 与 通信 教材 系列 ”项 
目 组 ， 选 派 了 富有 经 验 的 业务 骨干 负责 有 关 工 作 ， 收 集 了 230 余 种 通信 教材 和 参考 书 的 详细 资料 ， 调 
来 了 100 余 种 原版 教材 样 书 , 依靠 由 20 余 位 专家 组 成 的 出 版 委员 会 从 中 精 选 了 40 多 种 ,内 容 丰 富 ， 
覆盖 了 电路 理论 与 应 用 、 信 和 号 与 系统 、 数 字 信 和 号 处 理 、 微 电子 、 通 信 系 统 、 电 磁场 与 微波 等 方面 ， 既 
可 作为 通信 专业 本 科 生 和 研究 生 的 教学 用 书 ， 也 可 作为 有 关 专 业 人 员 的 参考 材料 。 此 外 ， 这 批 教材 ， 
有 的 翻译 为 中 文 ， 还 有 部 分 教材 直接 影印 出 版 ， 以 供 教 师 用 英语 直接 授课 。 和 希望 这 些 教材 的 引进 和 出 
版 对 高 校 通信 教学 和 教材 改革 能 起 一 定 作用 。 

在 这 里 ， 我 还 要 感谢 参加 工作 的 各 位 教授 、 专 家 、 老 师 与 参加 翻译 、 编 辑 和 出 版 的 同志 们 。 各 位 
专家 认真 负责 、 严 谨 细 致 、 不 辞 辛 劳 、 不 怕 珊 碎 和 精益 求 精 的 态度 ， 充 分 体现 了 中 国教 育 工 作者 和 出 
版 工作 者 的 良好 美德 。 

随 着 我 国 经 济 建设 的 发 展 和 科学 技术 的 不 断 进步 ， 对 高 校 教学 工作 会 不 断 提出 新 的 要 求 和 希望 。 
我 想 ， 无 论 如 何 ， 要 做 好 引进 国外 教材 的 工作 ,一定 要 联系 我 国 的 实际 。 教 材 和 学 术 专 著 不 同 ， 既 要 
注意 科学 性 、 学 术 性 , 也 要 重视 可 读 性 , 要 深入 浅 出 , 便于 读者 自学 ; 引进 的 教材 要 适应 高 校 教学 改 
革 的 需要 ， 针 对 目前 一 些 教材 内 容 较为 陈旧 的 问题 ， 有 目的 地 引进 一 些 先进 的 和 正在 发 展 中 的 交叉 学 
科 的 参考 书 ; 要 与 国内 出 版 的 教材 相配 套 , 安排 好 出 版 英文 原版 教材 和 翻译 教材 的 比例 。 我 们 努力 使 
这 套 教材 能 尽量 满足 上 述 要 求 ， 希 望 它们 能 放 在 学 生 们 的 课 桌 上 ， 发 挥 一 定 的 作用 。 

最 后 ， 预 祝 “ 国 外 电子 与 通信 教材 系列 ”项 目 取得 成 功 ， 为 我 国电 子 与 通信 教学 和 通信 产业 的 发 
展 培土 施肥 。 也 妨 切 希望 读者 能 对 这 些 书籍 的 不 足 之 处 、 特 别 是 翻译 中 存在 的 问题 , 提出 意见 和 建议 ， 
以 便 再 版 时 更 正 。 


Ahh A 
中 国 工 程 院 院士 、 清 华 大 学 教授 
“国外 电子 与 通信 教材 系列 ”出 版 委员 会 主任 


出 版 说 明 


进入 21 世纪 以 来 ， 我 国信 息 产业 在 生产 和 科研 方面 都 大 大 加 快 了 发 展 速度 ， 并 已 成 为 国民 经 济 
发 展 的 支柱 产业 之 一 。 但 是 ， 与 世界 上 其 他 信息 产业 发 达 的 国家 相 比 ， 我 国 在 技术 开发 、 教 育 培训 等 
方面 都 还 存在 着 较 大 的 差距 。 特 别 是 在 加 入 WTO 后 的 今天 ,我 国信 息 产 业 面临 着 国外 竞争 对 手 的 严 
峻 挑战 。 : 

作为 我 国信 息 产 业 的 专业 科技 出 版 社 ， 我 们 始终 关注 着 全 球 电子 信息 技术 的 发 展 方向 ， 始 终 把 引 
进 国外 优秀 电子 与 通信 信息 技术 教材 和 专业 书籍 放 在 我 们 工作 的 重要 位 置 上 。 在 2000 年 至 200 1 年 间 ， 
我 社 先后 从 世界 著名 出 版 公司 引进 出 版 了 40 余 种 教材 ， 形 成 了 一 套 “ 国 外 计算 机 科学 教材 系列 "， 在 
全 国 高 校 以 及 科研 部 门 中 受到 了 欢迎 和 好 评 , 得 到 了 计算 机 领域 的 广大 教师 与 科研 工作 者 的 充分 肯定 。 

引进 和 出 版 一 些 国外 优秀 电子 与 通信 教材 ， 尤 其 是 有 选择 地 引进 一 批 英 文 原版 教材 ， 将 有 助 于 我 
国信 息 产 业 培养 具有 国际 竞争 能 力 的 技术 人 才 ， 也 将 有 助 于 我 国 国内 在 电子 与 通信 教学 工作 中 掌握 和 
跟踪 国际 发 展 水 平 。 根 据 国内 信息 产业 的 现状 、 教 育 部 《关于 “十 五 ”期 间 普通 高 等 教育 教材 建设 与 
改革 的 意见 》 的 指示 精神 以 及 高 等 院 校 老 师 们 反映 的 各 种 意见 ， 我 们 决定 引进 “国外 电子 与 通信 教材 
系列 ”, 并 随后 开展 了 大 量 准备 工作 。 此 次 引进 的 国外 电子 与 通信 教材 均 来 自 国际 著名 出 版 商 ， 其 中 影 
印 教材 约 占 一 半 。 教 材 内 容 涉及 的 学 科 方 向 包括 电路 理论 与 应 用 、 信 号 与 系统 、 数 字 信 号 处 理 、 微 电 
子 、 通 信和 系统 、 电 磁场 与 微波 等 ， 其 中 既 有 本 科 专 业 课 程 教材 ， 也 有 研究 生 课程 教材 ， 以 适应 不 同 院 
系 、 不 同 专业 、 不 同 层次 的 师 生 对 教材 的 需求 ， 广 大 师 生 可 自由 选择 和 自由 组 合 使 用 。 我 们 还 将 与 国 
外 出 版 商 一 起 ， 陆 续 推 出 一 些 教材 的 教学 支持 资料 ， 为 授课 教师 提供 帮助 。 

此 外 ,“ 国 外 电子 与 通信 教材 系列 ”的 引进 和 出 版 工作 得 到 了 教育 部 高 等 教育 司 的 大 力 支 持 和 帮 
助 ， 其 中 的 部 分 引进 教材 已 通过 “教育 部 高 等 学 校 电子 信息 科学 与 工程 类 专业 教学 指导 委员 会 ”的 审 
核 ， 并 得 到 教育 部 高 等 教育 司 的 批准 ， 纳 入 了 “教育 部 高 等 教育 司 推荐 一 一 国外 优秀 信息 科学 与 技术 
系列 教学 用 书 ”。 

为 做 好 该 系列 教材 的 翻译 工作 , 我 们 聘请 了 清华 大 学 、 北 京 大 学 、 北 京 邮电 大 学 、 南 京 邮电 大 学 、 
东南 大 学 、 西 安 交 通 大 学 、 天 津 大 学 、 西 安 电 子 科 技 大 学 、 电 子 科技 大 学 、 中 山大 学 、 哈 尔 滨 工 业 大 
学 、 西 南 交 通 大 学 等 著名 高 校 的 教授 和 骨干 教师 参与 教材 的 翻译 和 审 校 工作 。 许 多 教授 在 国内 电子 与 
通信 专业 领域 享有 较 高 的 声望 ， 具 有 丰富 的 教学 经 验 ， 他 们 的 渊博 学 识 从 根本 上 保证 了 教材 的 翻译 质 
量 和 专业 学 术 方面 的 严格 与 准确 。 我 们 在 此 对 他 们 的 辛勤 工作 与 贡献 表示 衷心 的 感谢 。 此 外 ， 对 于 编 
辑 的 选择 ,我 们 达到 了 专业 对 口 ; 对 于 从 英文 原 书 中 发 现 的 错误 , 我们 通过 与 作者 联络 、 从 网 上 下 载 
勘误 表 等 方式 ， 逐 一 进行 了 修订 ;” 同 时， 我 们 对 审 校 、 排 版 、 印 制 质量 进行 了 严格 把 关 。 

今后 , 我 们 将 进一步 加 强 同 各 高 校 教师 的 密切 关系 , 努力 引进 更 多 的 国外 优秀 教材 和 教学 参考 书 ， 
为 我 国电 子 与 通信 教材 达到 世界 先进 水 平 而 努力 。 由 于 我 们 对 国内 外 电子 与 通信 教育 的 发 展 仍 存在 一 
些 认识 上 的 不 足 ， 在 选 题 、 翻 译 、 出 版 等 方面 的 工作 中 还 有 许多 需要 改进 的 地 方 ， 奶 请 广大 师 生 和 读 
者 提出 批评 及 建议 。 
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数字 图 像 处 理 起 源 于 20 世 纪 20 年 代 , 当时 通过 海底 电缆 从 英国 的 伦敦 到 美国 的 纽约 采用 数字 压缩 
技术 传输 了 第 一 张 数字 照片 。 此 后 ， 由 于 遥感 等 领域 的 应 用 ， 图 像 处 理 技 术 逐 步 受到 关注 并 得 到 相应 
的 发 展 。 由 于 技术 手段 的 限制 ， 图 像 处 理科 学 与 技术 的 发 展 相当 缓慢 ， 直 到 第 三 代 计 算 机 问世 后 ， 数 
字 图 像 处 理 才 开始 迅速 发 展 并 得 到 普遍 应 用 。CT 的 发 明 、 应 用 及 获得 倍 受 科技 界 瞩 目的 诺 贝尔 奖 , 使 
得 图 像 处 理 技术 大 放 异 彩 。 目 前 数字 图 像 处 理科 学 已 成 为 工程 学 、 计 算 机 科学 、 信 息 科学 、 统 计 学 、 
物理 学 、 化 学 、 生 物 学 、 医 学 甚至 社会 科学 等 领域 学 习 和 研究 的 对 象 。 随 着 信息 高 速 公 路 、 数 字 地 球 
概念 的 提出 及 互联 网 的 广泛 应 用 ， 图 像 处 理 技术 的 需求 与 日 俱 增 。 其 中 ， 图 像 信息 以 其 信息 量 大 、 伟 
输 速度 快 、 作 用 距离 远 等 一 系列 优点 ， 成 为 人 类 获取 信息 的 重要 来 源 及 利用 信息 的 重要 手段 ， 因 此 
图 像 处 理科 学 与 技术 逐步 向 其 他 学 科 领 域 渗透 并 为 其 他 学 科 利 用 是 理所当然 的 。 图 像 处 理科 学 = 
门 与 国计民生 紧密 相关 的 应 用 科学 ， 它 已 给 人 类 带 来 了 巨大 的 经 济 效益 和 社会 效益 ， 不 和 久 的 将 来 它 
仅 在 理论 上 会 有 更 深入 的 发 展 ， 在 应 用 上 亦 是 科学 研究 、 ea 
有 具 。 它 的 发 展 及 应 用 与 我 国 的 现代 化 建设 联系 之 密切 、 影 响 之 深远 是 不 可 估量 的 。 在 信息 社会 中 ， 图 
像 处 理科 学 无 论 是 在 理论 上 还 是 在 实践 中 ,都 有 着 巨大 的 潜力 。 

本 书 第 一 版 于 1977 年 问世 ， 它 是 作者 在 为 大 学 高 年 级 学 生 和 研究 生 编 写 的 讲义 的 基础 上 整理 而 
成 的 ， 全 书 只 有 七 章 。 该 书 深 入 浅 出 ， 图 文 并 茂 ， 概 念 清楚 ， 通 俗 易 懂 ， 是 很 受 欢迎 的 教科 书 。 特 别 
是 对 非 英语 国家 的 学 生 和 科技 工作 者 ， 阅 读 原 文 也 会 觉得 赏心悦目 ， 朗 朗 上 口 ， 给 读者 留 下 了 深刻 的 
印象 。 我 想 这 是 该 书 被 广泛 用 做 教材 的 根本 所 在 。 本 书 是 该 书 的 第 三 版 ， 这 一 版 除 保留 了 该 书 的 传统 
风格 外 , 在 内 容 上 进行 了 大 幅度 的 修订 与 重组 , 作者 根据 反馈 意见 从 13 个 方面 对 本 书 进行 了 修订 , 新 
增 了 400 余 幅 图 像 、200 多 幅 图 表 及 80 多 道 习题 ， 同 时 融入 了 近年 来 本 科学 领域 的 重要 进展 , 使 得 本 
书 更 加 充实 与 全 面 。 

本 书 共 分 12 章 ， 分 别 为 绪论 、 数 字 图 像 基础 、 灰 度 变 换 与 空间 滤波 、 频 率 域 滤 波 、 图 像 复 原 与 
重建 、 彩 色 图 像 处 理 、 小 波 与 多 分 辩 率 处 理 、 图 像 压 缩 、 形 态 学 图 像 处 理 、 图 像 分 割 、 表 示 与 描述 、 
目标 识别 。 

为 了 统一 全 书 的 语言 风格 ， 参 加 翻译 的 人 员 较 少 。 全 书 第 1 章 至 第 7 章 及 前 言 、 目 录 、 致 谢 、 关 
于 作者 等 由 阮 秋 琦 翻译 ， 其 余 内 容 均 由 阮 宇智 同 志 翻译 ; 全 书 由 阮 秋 琦 统一 整理 与 审 校 。 由 于 时 间 仓 
促 ， 难 以 达到 “ 信 、 达 、 雅 ”的 高 标准 ， 退 而 求 其 次 ， 尽 量 做 到 译文 准确 ， 风 格 统一 。 

本 书 在 翻译 中 得 了 许多 同学 的 帮助 ， 对 此 ， 译 者 深 表 感谢 。 由 于 译 者 水 平 所 限 ， 书 中 一 定 会 有 许 
多 错误 和 不 当 之 处 ， 恳 切 地 希望 读者 提出 宝贵 的 建议 和 批评 。 
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When something can be read without effort, great effort has gone into its writing. 


Enrique Jardiel Poncela 


第 三 版 是 本 书 的 一 次 重要 修订 。 如 同 由 Gonzalez 和 Wintz 编写 的 1977 年 版 和 1988 年 版 ,以 及 由 
Gonzalez 和 Woods 编写 的 1992 年 版 和 2002 年 版 那样 , 这 一 版 同样 是 为 学 生 和 教师 考虑 而 准备 的 。 本 
书 的 主要 目的 仍 是 介绍 数字 图 像 处 理 的 基本 概念 和 方法 ， 并 为 读者 在 该 领域 进一步 学 习 和 研究 打下 坚 
实 的 基础 。 为 实现 这 一 目的 ， 我 们 仍 将 重点 放 在 基础 知识 和 普通 应 用 上 。 本 书 要 求 读者 的 数学 知识 具 
备 大 学 本 科 高 年 级 和 研究 生 一 年 级 的 水 平 ， 即 需要 掌握 数学 分 析 、 向 量 、 和 矩阵 、 概 率 、 统 计 、 线 性 系 
统 和 计算 机 编程 方面 的 基本 知识 。 本 书 的 Web 网 站 为 读者 提供 了 所 需 背 景 知识 的 回顾 指南 。 

本 书 在 数字 图 像 处 理 领 域 处 于 引领 地 位 30 多 年 的 主要 原因 是 ， 我 们 对 读者 不 断 变化 的 教育 需求 
给 予 了 极 大 的 关注 。 第 三 版 是 在 我 们 广泛 调查 的 基础 上 编写 的 , 这 些 调查 涉及 32 个 国家 的 134 所 高 校 
和 研究 机 构 的 教师 、 学 生 与 自学 者 。 根 据 调 查 的 反馈 情况 ， 本 书 做 了 如 下 修订 : 


更 早 、 更 全 面 地 介绍 了 图 像 处理 中 所 用 的 数学 工具 。 

扩充 说 明了 直方 图 处 理 技术 。 

逐步 叙述 了 复杂 的 算法 。 

扩充 说 明了 空间 相关 和 卷 积 的 内 容 。 

介绍 了 模糊 集合 理论 及 其 在 图 像 处 理 中 的 应 用 。 

修订 了 频率 域 处 理 的 内 容 ， 从 基本 原理 开始 ， 说 明了 如 何 从 数据 取样 得 出 离散 傅 里 叶 变 换 。 
履 盖 了 关于 计算 机 断层 CT) 的 内 容 。 

清楚 地 叙述 了 小 波 的 基本 概念 。 

修订 了 关于 数据 压缩 的 内 容 ， 包 含 了 更 多 的 视频 压缩 技术 、 标 准 和 水 印 。 

扩充 了 形态 学 的 章节 ,包含 了 形态 学 重建 的 内 容 ， 修 订 了 灰 度 形态 学 的 内 容 。 

扩充 了 图 像 分 割 的 内 容 , 包含 了 更 先进 的 技术 , 如 坎 尼 算 法 的 边缘 检测 技术 ,更 全 面 地 探讨 了 
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更 新 了 图 像 表 示 与 描述 章节 的 内 容 。 

精简 了 关于 结构 目标 识别 的 内 容 。 


第 三 版 中 的 新 内 容 和 重新 组 织 的 内 容 试 图 在 论述 的 严密 性 、 描 述 的 清晰 性 和 市 场 调查 的 反馈 之 间 
保持 平衡 ， 同 时 尽量 将 篇 幅 控 制 在 合理 的 范围 内 。 第 三 版 的 主要 改动 如 下 。 

第 1 章 : 更 新 了 图 片 ， 并 根据 后 续 章 节 的 变化 重 写 了 正文 部 分 。 

第 2 章 : 本 章 约 修订 了 50% 的 内 容 , 包含 了 新 图 像 和 更 清晰 的 说 明 。 主 要 修订 包括 : 新 增 了 关于 图 像 
内 插 的 一 节 ， 以 及 综述 本 书 所 用 主要 数学 工具 的 一 节 。 此 前 分 散在 全 书 中 的 大 量 图 像 处 理应 用 现在 整合 到 
了 第 2 章 中 。 例 如 ， 我 们 把 图 像 平均 和 图 像 相 成 移 到 了 这 一 章 。 这 遵循 了 我 们 在 第 二 版 中 就 开始 的 做 法 ， 
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即 在 讨论 中 尽 可 能 把 许多 应 用 前 移 ， 以 便 更 好 地 引导 读者 。 学 完 重新 组 织 的 第 2 章 后 ， 读 者 可 基本 了 解 
数字 图 像 加 工 和 处 理 的 方式 。 本 章 是 编写 本 书 其 余 章节 的 坚实 基础 。 

第 3 章 : 本 章 的 主要 修订 是 ， 详 细 探 讨 了 空间 相关 、 卷 积 及 利用 空间 模板 对 图 像 滤 波 的 应 用 。 我 
们 在 进行 市 场 调查 时 发 现 了 读者 普遍 关心 的 一 个 问题 ， 即 要 求 用 大 量 实例 来 说 明 直方 图 均衡 化 和 规定 
化 ， 对 这 一 问题 的 回应 是 ， 我们 增加 了 一 些 说 明 这 些 处 理工 具 的 例子 。 模 糊 集合 及 其 在 图 像 处 理 中 的 
应 用 也 是 调查 反馈 普遍 要 求 的 内 容 ， 因 此 本 章 中 纳入 了 模糊 集合 理论 基础 及 其 在 灰 度 变换 与 空间 滤波 
两 种 图 像 处 理 中 的 主要 应 用 。 

第 4 章 : 过 去 4 年 ， 读 者 抱怨 得 最 多 的 是 对 第 一 版 和 第 二 版 的 第 4 章 所 做 的 更 改 。 当 时 做 出 这 些 
改变 时 ， 目 的 是 为 了 简化 傅 里 叶 变 换 和 频率 域 的 表述 。 显 然 ， 我 们 走 得 太 远 ， 因 为 读者 抱怨 新 内 容 太 
浅 。 第 三 版 纠正 了 这 一 问题 。 现 在 的 内 容 从 连续 变量 的 傅 里 叶 变 换 开 始 ， 再 用 取样 和 卷 积 的 基本 概念 
进一步 推导 了 离散 傅 里 叶 变 换 。 这 种 变化 的 优点 是 ， 更 直观 地 引入 了 取样 定理 。 然 后 ， 我 们 将 一 维 情 
形 推广 到 了 二 维 情形 ， 并 给 出 了 说 明 数字 图 像 取样 效果 的 一 些 例 子 。 再 后 ， 我 们 介绍 了 二 维 离散 傅 里 
叶 变 换 ， 推 导 和 总 结 了 一 些 重要 性 质 。 这 些 概念 是 频率 域 滤波 的 基础 。 最 后 ， 我 们 讨论 了 问题 实现 ， 
如 变换 分 解 和 快速 傅 里 叶 变换 算法 的 推导 。 学 完 本 章 后， 读者 可 掌握 从 一 维 函 数 的 取样 到 离散 傅 里 叶 
变换 基础 的 清晰 推导 过 程 ， 以 及 其 在 数字 图 像 处理 中 的 某 些 重要 应 用 。 

第 5 章 : 本 章 增加 了 关于 从 投影 重建 图 像 的 一 节 ， 重 点 在 于 计算 机 断层 (CT) 。CT 的 内 容 用 投影 
重建 图 像 的 基本 原理 和 实践 中 所 用 成 像 模型 的 例子 开始 。 然 后 ， 推 导 了 雷 登 变换 和 傅 里 叶 切片 定理 ， 
并 以 它们 为 基础 清楚 地 说 明了 滤波 反 投 影 的 概念 。 讨 论 了 平行 光束 和 扇形 光束 重建 ， 并 用 一 些 例子 进 
行 了 说 明 。 这 些 内 容 较 老 ， 但 对 本 书 是 重要 的 补充 。 

第 6 章 : 本 章 只 做 了 符号 表示 的 漆 清 和 更 正 ， 未 增加 新 内 容 。 

第 7 章 : 读者 反馈 从 前 一 章 过 渡 到 小 波 对 初学 者 来 说 较为 困难 ， 因 此 我 们 重 写 了 一 些 基础 内 容 。 

第 8 章 : 为 使 内 容 跟 上 发 展 形势 ， 本 章 已 完全 重 写 。 新 编码 技术 内 容 扩展 到 了 视频 , 修订 了 标准 ， 
介绍 了 图 像 水 印 处 理 。 这 种 新 的 编排 方式 更 易于 学 生 掌 握 。 

第 9 章 : 本 章 的 主要 变化 是 包含 了 形态 学 重建 的 新 内 容 ， 修 订 了 灰 度 级 形态 学 的 内 容 ， 并 详细 介 
绍 了 二 值 图 像 和 灰 度 级 图 像 的 形态 学 重建 ， 以 便 学 生 开 发 出 更 复杂 、 更 有 用 的 形态 学 算法 。 

第 10 章 : 本 章 做 了 大 量 修订 。 组 织 方式 与 之 前 相同 ,但 新 增 了 关于 分 割 技术 的 内 容 , 详细 讨论 并 
说 明了 边缘 模型 及 其 性 质 。 介 绍 先进 的 边缘 检测 技术 时 ， 包 含 了 Marr-Hildreth 边缘 检测 器 和 坎 尼 边缘 
检测 器 。 重 写 了 关于 阔 值 处 理 的 一 节 , 包含 了 较为 流行 的 Otsu 方 法, 这 种 方法 易于 理解 和 实现 ， 且 应 
用 广泛 。 关 于 贝 叶 斯 方法 的 内 容 则 移 到 第 12 章 介绍 ， 那 时 还 会 详细 探讨 贝 叶 斯 决策 规则 。 此 外 ， 还 
讨论 了 如 何 利 用 边缘 信息 来 改进 阐 值 处 理 , 并 给 出 了 自 适 应 阐 值 处 理 的 新 例子 。 关 于 形态 学 分 水 岭 和 
运动 分 割 应 用 的 内 容 ， 除 阐述 更 为 清楚 外 ， 基 本 上 未 做 改动 。 

第 11 章 : 本 章 的 主要 变化 是 边界 跟踪 算法 ， 详 细 推导 了 用 最 小 周 长 多 边 形 拟 合 数字 边界 的 算法 ， 
增加 了 用 于 纹理 描述 的 共生 和 矩阵 内 容 。 与 11.4 节 的 所 有 例子 一 样 ，11.2 节 和 11.3 节 中 的 许多 例子 都 是 
新 的 。 

第 12 章 : 本 章 的 变化 是 , 新 增 了 关于 相关 匹配 的 内 容 ， 以 及 用 贝 叶 斯 分 类 器 识别 多 光谱 图 像 中 感 
兴趣 区 的 新 例子 。 结 构 分 类 方面 的 章节 只 限于 讨论 串 匹 配 。 

以 上 修订 ， 导 致 了 本 书 新 增 了 400 多 幅 图 像 、200 多 幅 图 表 和 80 多 道 习 题 。 书 中 适当 的 位 置 给 出 
了 复杂 处 理 过 程 的 逐步 算法 。 同 时 ， 更 新 了 参考 文献 。 

本 书 的 Web 网 站 在 第 二 版 发 行 期 间 就 已 完成 ， 并 取得 了 很 大 的 成 功 ,每 月 的 访问 量 都 在 20000 以 


上 。 相 应 于 第 三 版 本 ， 我 们 重新 设计 和 升级 了 这 一 网 站 。 关 于 该 网 站 的 详细 功能 和 内 容 ， 请 读者 参阅 
后 面 的 “本 书 网 站 ”和 “致谢 ”部 分 。 

第 三 版 反映 了 2002 年 以 来 读者 不 断 变 化 的 需求 。 自 1977 年 首次 出 版 以 来 ， 本 书 在 全 球 范 围 内 被 
读者 广泛 接受 的 原因 之 一 是 ， 本 书 一 直 强调 基 本 概念 ， 包 括 试图 提供 尽快 引出 知识 主体 的 稳定 方法 。 
我 们 遵循 相同 的 原则 编写 了 本 书 的 第 三 版 。 


Rafael C. Gonzalez 
Richard E. Woods 
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感谢 高 校 . 业界 和 政府 中 为 本 书 做 出 贡献 的 诸多 同仁 , 你 们 的 贡献 非常 重要 。 特别 感谢 同事 Mongi 
A. Abidi, Steven L. Eddins, Yongmin Kim, Bryan Morse, Andrew Oldroyd, Ali M. Reza, Edgardo Felipe 
Riveron, Jose Ruiz Shulcloper 和 Cameron H. G. Wright， 感 谢 你 们 在 表达 方式 和 有 覆盖 范围 方面 所 提出 的 
建议 。 

撰写 第 三 版 期 间 ， 许 多 个 人 和 组 织 为 我 们 提供 了 有 价值 的 帮助 。 特 别 感谢 Mathworks 公司 的 
Courtney Esposito 和 Naomi Ferandes， 感 谢 你 们 为 我 们 提供 了 MATLAB 软件 与 支持 ， 这 对 创建 或 曾 
述 第 三 版 中 的 许多 实例 和 实验 结果 非常 重要 。 第 三 版 中 的 很 多 新 图 像 都 是 通过 个 人 努力 得 到 的 ， 在 此 
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关于 作者 


Rafael C. Gonzalez (#738 /R * C > 冈 萨 雷 斯 ) 


1965 于 美国 迈阿密 大 学 获 电 气 工程 学 士 学 位 ; 1967 年 和 1970 年 于 美国 佛罗里达 大 学 盖 恩 斯 维尔 
分 校 分 别 获 电气 工程 硕士 学 位 和 博士 学 位 。1970 年 , 加 盟 田纳西 大 学 诺 克 斯 维尔 分 校 (UTK) 电 机 和 计 
算 机 工程 系 。1973 年 晋升 为 副教授 ，1978 年 晋升 为 教授 ，1984 年 被 授予 “杰出 贡献 教授 "。1994 年 到 
1997 年 任 系 主任 ， 现 为 UTK 名 誉 教授 。 

冈 萨 雷 斯 是 田纳西 大 学 “图 像 与 模式 分 析 实 验 室 ”和 “机 器 人 与 计算 机 视觉 实验 室 ” 的 创始 人 。 
还 于 1982 年 创立 了 感知 公司 , 并 任 公 司 总 裁 直至 1992 年 , 期 间 的 后 三 年 全 职 受 聘 于 其 在 1989 年 收购 
的 Westinghouse 公司 。 

在 其 引领 下 ,感知 公司 在 图 像 处 理 、 计 算 机 视觉 和 光盘 存储 技术 等 领域 取得 了 很 大 的 成 功 . 前 10 
年 ， 公 司 推出 了 一 系列 创新 产品 ， 包 括 : 计算 机 视觉 系统 ， 这 是 全 球 首 台 商用 系统 ， 可 自动 阅读 行驶 
车 辆 的 车 牌 ; 大 规模 图 像 处 理 和 归档 系统 ， 美 国 海军 在 不 同 地 点 使 用 该 系统 来 检测 三 又 荆 洪 艇 项 目 中 
导弹 的 火箭 发 动机 ; 为 苹果 计算 机 设计 的 图 像 卡 ; 万 亿 (102) 字 节 光 盘 生 产 线 。 

他 还 是 模式 识别 、 图 像 处 理 和 机 器 学 习 领 域 的 企业 和 政府 顾问 。 他 在 这 些 领 域 获得 的 荣誉 包括 : 
1977 年 获 UTK 工学 院 职员 成 就 奖 ; 1978 年 获 UTK 校长 研究 学 者 奖 ; 1980 年 获 Magnavox 工程 教授 
奖 ; 1980 年 获 M. E. Brooks 杰出 教授 奖 ; 1981 年 , 成 为 田纳西 大 学 的 IBM 教授 并 于 1984 年 被 授予 杰 
出 成 就 教授 ; 1985 年 ， 被 迈阿密 大 学 授予 杰出 男 毕 业 生 奖 ，1986 年 ， 被 授予 Phi Kappa Phi 学 者 奖 ; 
1992 年 ， 获 田纳西 大 学 Nathan W. Dougherty 工程 优秀 奖 。 

工业 界 荣誉 包括 : 1987 年 因 田 纳西 的 商业 开发 获 IEEE 杰出 工程 师 奖 ; 1988 年 因 商 业 图 像 处 理 的 
优秀 表现 获 Albert Rose Nat 奖 ; 1989 年 因 在 技术 转化 方面 的 优秀 表现 获 Otto Wheeley 奖 ; 1989 年 获 
Coopers 和 Lybrand 发 起 人 年 度 奖 ; 1992 年 获 IEEE 第 3 区 杰出 工程 师 奖 ; 1993 年 因 技术 开发 获 自动 
成 像 协 会 国家 奖 。 

冈 萨 雷 斯 在 模式 识别 、 图 像 处 理 和 机 器 人 领域 发 表 或 合作 发 表 了 100 多 篇 论文 , 出 版 了 两 本 专著 及 
4 本 教材 , 被 遍布 全 球 的 1000 多 所 大 学 和 研究 机 构 采用 。 他 被 《全 美 名 人 传记 》《 工 程 名 人 传记 》《 世 
界 名 人 传记 》 和 10 多 个 其 他 传记 收录 。 他 是 两 个 美国 专利 的 共同 持 有 者 , 同时 一 直 是 IEEE Transactions 
on Systems , Man and Cybernetics 和 International Journal of Computer and Information Sciences 的 副 主编 。 
他 是 许多 专业 学 会 和 名 誉 学 会 的 会 员 ， 如 Tau Beta Pi, Phi Kappa Phi, Eta Kappa Nu 和 Sigma Xi. {th 
还 是 IEEE 会 士 。 


Richard E. Woods ( 理 查 德 。 E + 伍兹 ) 


HAW E- f2, UTK 电气 工程 系 学 士 、 硕 士 和 博士 。 从 业经 历 包 括 企业 家 、 大 学 教师 、 咨 询 、 
企业 管理 和 工业 工程 。 最 近 创 立 了 专门 开发 医用 手持 式 计 算 机 系统 的 MedData Interactive 公司 。 他 还 
是 感知 公司 的 创始 人 和 副 总 载 ， 负 责 公司 的 定量 图 像 分 析 和 自动 决策 产品 的 开发 工作 。 


在 加 入 感知 公司 和 MedData 公司 前 , 伍 效 博士 是 田纳西 大 学 电气 工程 和 计算 机 科学 专业 的 助理 教 
授 , 再 之 前 是 Union Carbide 公司 的 计算 机 应 用 工程 师 。 作 为 顾问 , 他 为 许多 空间 和 军事 机 构 开 发 了 大 
量 专用 数字 处 理 器 ， 这 些 机 构 包 括 NASA、 弹 道 导弹 司令 部 和 橡树 岭 国家 实验 室 。 

伍兹 博士 发 表 了 大 量 有 关 数 字 信号 处 理 方面 的 文章 , 并 且 是 几 个 专业 学 会 的 成 员 , 包括 Tau Beta Pi, 
Phi Kappa Phi 和 IEEE。1986 年 ， 获 得 田纳西 大 学 杰出 工程 毕业 生 称 号 。 


庶 以 此 书 献 给 Smmantha、Janice、David 和 Jonathan. 


本 书 网 站 


www.prenhall.com/gonzalezwoods 
或 镜像 网 站 


www.imageprocessingplace.com 


本 书 自 成 体系 ， 但 参考 网 站 为 许多 重要 的 领域 提供 了 有 力 的 支持 。 
对 于 学 生 或 自学 者 ， 网 站 内 容 包括 : 


e _ 概率、 统计、 向 量 和 和 珑 阵 的 回顾 。 

@ 部 分 习题 的 完整 解答 。 

@ 计算 机 项 目 。 

@ 本 书 所 讨论 大 部 分 主题 的 辅导 内 容 。 

@ 本 书 中 所 用 的 全 部 图 像 。 

对 于 教师 ， 网 站 内 容 包括 : 

o 书 中 所 有 习题 的 解答 及 课堂 和 实验 教学 手册 ， 这 些 内 容 对 采用 本 书 作 为 教材 的 教师 免费 。 
@ 课堂 教学 PPT. 

@ 以 前 版 本 中 删除 的 内 容 (PDF 格式 ). 

o 其 他 教学 资源 链接 。 


对 于 专业 人 员 ， 网 站 中 还 包括 一 些 特殊 的 主题 : 

@ 商业 网 站 链接 。 

© 部 分 新 参考 文献 。 

o 商业 图 像 数据 库 链 接 。 

图 书 出 版 后 ， 为 确保 图 书 内 容 的 更 新 ， 在 需要 添加 新 课题 、 数 字 图 像 和 其 他 相关 内 容 时 ，Web 网 


站 是 很 方便 的 场所 。 虽 然 在 出 版 本 书 时 已 做 了 仔细 考虑 ， 但 网 站 对 于 发 布 任何 印刷 错误 仍 是 很 方便 的 
场所 。Web 网 站 在 书 中 设计 了 如 下 图 形 : 





© 


Pearson 


FRNA: 

您 好 ! 

为 了 确保 您 及 时 有 效 地 申请 培 生 整体 教学 资源 , 请 您 务必 完整 填写 如 下 表格 , 加 盖 学 院 的 公章 后 传真 
给 我 们 , 我 们 将 会 在 2-3 个 工作 日 内 为 您 处 理 。 
请 填写 所 需 教 辅 的 开课 信息 : 


口中 文 版 口 英 文 版 口 双 语 版 


口 本 科 1/2 年 级 
口 研究 生 口 本 科 3/4 年 级 





请 填写 您 的 个 人 信息 : 


院 系 /专业 


Oo ta | | m m | Dw Ow omen oe 


通信 地 址 /邮编 





eg:XXX@163.com 
口 是 OF 


是 否 原意 接受 我 们 定期 的 新 书 讯 息 通 知 : 


系 / 院 主任 : (签字 ) 
(KH / 院 办 公 室 章 ) 
年 月 日 
资源 介绍 : 
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~ One picture is worth more than ten thousand words. 


Anonymous 


引言 


数字 图 像 处 理 方法 的 重要 性 源 于 两 个 主要 应 用 领域 : 改善 图 示 信 息 以 便 人 们 解释 ;为 存储 、 传 输 
和 表示 而 对 图 像 数据 进行 处 理 ， 以 便于 机 器 自动 理解 。 本 章 有 几 个 主要 目的 : (1) 定义 我 们 称 之 为 图 像 
处 理 领域 的 范围 ; (2) 从 历史 观点 回顾 图 像 处 理 的 起 源 ; (3) 考察 一 些 主要 的 应 用 领域 ， 给 出 图 像 处 理 
技术 状况 的 概念 ; (4) 简要 讨论 数字 图 像 处 理 中 所 用 的 主要 方法 ; (5) 概述 典型 通用 图 像 处 理 系统 的 组 
成 ; (6) 列 出 数字 图 像 处 理 领 域 已 公开 发 表 的 一 些 图 书 和 文献 。 


1.1 什么 是 数字 图 像 处 理 


一 幅 图 像 可 定义 为 一 个 二 维 函 数 f(x,y), 其 中 x 和 yy 是 空间 (平面 ) 坐 标 ,而 在 任何 一 对 空间 坐标 (Gx, y) 
处 的 幅 值 了 称 为 图 像 在 该 点 处 的 强度 或 灰 度 。 当 x, y 和 灰 度 值 /是 有 限 的 离散 数值 时 ， 我 们 称 该 图 像 为 
数字 图 像 。 数 字 图 像 处 理 是 指 借助 于 数字 计算 机 来 处 理 数字 图 像 。 注 意 ， 数 字 图 像 是 由 有 限 数 量 的 元 素 
组 成 的 ， 每 个 元 素 都 有 一 个 特定 的 位 置 和 幅 值 。 这 些 元 素 称 为 图 画 元 素 、 图 像 元 素 或 像素 。 像 素 是 广泛 
用 于 表示 数字 图 像 元 素 的 术语 。 在 第 2 章 ， 我 们 将 用 更 正式 的 术语 来 考虑 这 些 定义 。 

视觉 是 人 类 最 高 级 别 的 感知 ， 所 以 图 像 在 人 类 感知 中 扮演 着 最 重要 的 角色 。 然 而 ， 人 类 的 感知 仅 
限于 电磁 波谱 的 可 见 光波 段 ; 与 人 类 不 同 ， 成 像 机 器 几乎 可 以 覆盖 从 件 马 射线 到 无 线 电 波 的 整个 电磁 
波谱 范围 。 它 们 可 以 对 人 类 不 习惯 的 那些 图 像 源 进行 加 工 ， 包 括 超声 波 、 电 子 显微镜 和 计算 机 产生 的 
图 像 。 因 而 ,数字 图 像 处 理 涉及 很 宽泛 的 各 种 应 用 领域 。 

关于 图 像 处 理 止 于 何 处 或 其 他 相关 领域 (如 图 像 分 析 和 计算 机 视觉 ) 从 何 处 开始 ， 创 始 人 之 间 并 
没有 一 致 的 看 法 。 有 时 ， 用 输入 和 输出 内 容 都 是 图 像 这 一 规范 来 界定 图 像 处 理 的 范围 。 我 们 认为 这 有 
点 局 限 ， 是 人 为 的 界定 。 例 如 ， 在 这 种 定义 下 ， 甚 至 计算 一 幅 图 像 的 平均 灰 度 (结果 为 一 个 数字 ) 这 样 
简单 的 任务 都 不 能 算是 图 像 处 理 。 男 一 方面 ， 有些 领域 (如 计算 机 视觉 ) 的 最 终 目标 是 使 用 计算 机 来 模 
拟人 的 视觉 ， 包 括 理解 并 根据 视觉 输入 采取 动作 等 。 该 领域 本 身 是 人 工 智 能 (AD) 的 一 个 分 支 ， 其 目的 
是 模仿 人 类 智能 。 人 工 智能 领域 正 处 于 发 展 过 程 的 初级 阶段 ,其 发 展 要 比 预期 的 慢 得 多 。 图 像 分 析 (也 
称 为 图 像 理 解 ) 领域 则 处 在 图 像 处 理 和 计算 机 视觉 之 间 。 


D 每 页 下 方 阴影 框 中 的 数字 表示 译文 对 应 的 原 书页 码 ， 索 引 中 的 页 码 为 原 书页 码 。 一 一 编者 注 
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从 图 像 处 理 到 计算 机 视觉 的 这 个 连续 统一 体内 并 没有 明确 的 界限 。 然 而 ,一 种 有 用 的 范例 是 在 这 
个 连续 的 统一 体 中 考虑 三 种 典型 的 计算 处 理 ， 即 低级 、 中 级 和 高 级 处 理 。 低 级 处 理 涉及 初级 操作 ， 如 
降低 噪声 的 图 像 预 处 理 、 对 比 度 增强 和 图 像 锐 化 。 低 级 处 理 以 输入 、 输 出 都 是 图 像 为 特征 。 中 级 处 理 
涉及 诸多 任务 ， 壁 如 (把 一 幅 图 像 分 为 不 同 区 域 或 目标 的 ) 分 割 ， 减 少 这 些 目 标 物 的 描述 ， 以 使 其 更 迁 
合计 算 机 处 理 及 对 不 同 目标 的 分 类 (识别 ) 。 中 级 图 像 处 理 以 输入 为 图 像 但 输出 是 从 这 些 图 像 中 提取 的 
特征 (如 边缘 、 轮 廓 及 各 物体 的 标识 等 ) 为 特征 。 最 后 ， 高 级 处 理 涉及 “理解 ”已 识别 目标 的 总 体 ， 就 
像 在 图 像 分 析 中 那样 ， 以 及 在 连续 统一 体 的 远 端 执行 与 视觉 相关 的 认 知 功能 。 

基于 上 述 讨论 我 们 可 以 看 到 ， 图 像 处 理 和 图 像 分 析 之 间 合 乎 逻辑 的 重 一 部 分 就 是 图 像 中 各 个 区 域 
或 目标 的 识别 这 一 领域 。 这 样 ， 在 本 书 中 ， 我们 就 将 数字 图 像 处 理 界定 为 其 输入 和 输出 都 是 图 像 的 处 
H, 另外 , 包含 从 图 像 中 提取 特征 的 处 理 ， 直至 包括 各 个 目标 的 识别 。 作 为 一 个 澄清 这 些 概 念 的 说 明 ， 
我 们 考虑 文本 自动 分 析 这 一 领域 .获取 包含 有 文本 的 区 域 的 一 幅 图 像 ,对 该 图 像 进行 预 处 理 ,以 提取 (分 
割 ) 各 个 字符 ,以 适合 于 计算 机 处 理 的 形式 描述 这 些 字符 , 识别 这 些 字符 , 这 些 都 在 本 书 界定 的 数字 图 
像 处 理 范畴 内 。 理 解 一 页 的 内 容 可 能 要 根据 “理解 ”词句 的 复杂 度 ， 从 图 像 分 析 领 域 甚至 计算 机 视觉 
来 考虑 。 这 很 快 就 会 变 得 很 明显 ， 就 像 我 们 已 定义 的 那样 ， 数 字 图 像 处 理 可 成 功 地 用 于 具有 特殊 社会 
和 经 济 价值 的 广泛 领域 。 后 面 各 章 中 给 出 的 概念 是 这 些 应 用 领域 中 所 用 方法 的 基础 。 


1.2 ”数字 图 像 处 理 的 起 源 


数字 图 像 的 最 早 应 用 之 一 是 在 报纸 业 ， 当 时 ， 图 片 第 一 次 通过 海底 电缆 从 伦敦 传 往 纽 约 。 早 在 20 
世纪 20 年 代 曾 引入 巴 特 兰 (Bartlane) 电缆 图 片 传输 系统 ， 把 横 跨 大 西 详 传送 一 幅 图 片 所 需 的 时 间 从 一 
个 多 星期 减少 到 了 3 小 时 。 为 了 用 电缆 传输 图 片 ， 首 先 使 用 特殊 的 打印 设备 对 图 片 编码 ， 然 后 在 接收 
端 重 构 这 些 图 片 。 图 1.1 就 是 用 这 种 方法 传送 并 利用 装 有 打印 机 字体 的 电报 打印 机 模拟 中 间 色 调 还 原 
的 图 像 

这 些 早期 数字 图 片 视觉 质量 的 改进 中 的 初始 问题 涉及 打印 过 程 的 选择 和 亮度 等 级 的 分 布 。 用 于 得 
到 图 1.1 所 示 图 像 的 打印 方法 到 1921 年 底 就 被 彻底 淘汰 , 转 而 支持 一 种 基于 照相 还 原 的 技术 , 即 在 电报 
接收 端 使 用 穿孔 纸 带 来 还 原 图 片 。 图 1.2 显示 了 使 用 这 种 方法 得 到 的 一 幅 图 像 。 与 图 1.1 相 比 ， 它 在 色 
调 质量 和 分 辩 率 方面 的 改进 都 很 明显 。 





图 1.1 1921 年 由 电报 打印 机 采用 特殊 字体 在 编码 纸 带 ”图 1.2 1922 年 在 信号 两 次 穿越 大 西洋 后 ， 由 穿孔 纸 
上 产生 的 数字 图 片 ( 原 图 像 由 McFarlane 提供 站 带 得 到 的 数字 图 片 ( 原 图 像 由 McFarlane 提供 ) 


早期 的 巴特 兰 系统 可 以 使 用 5 个 不 同 的 灰 度 级 来 编码 图 像 。 到 1929 年 , 这 一 能 力 已 增 大 到 15 级 。 
图 1.3 所 未 的 这 种 典型 图 像 就 是 用 15 级 色调 设备 得 到 的 。 在 这 一 时 期 ， 由 于 引入 了 一 种 使 用 编码 图 片 
纸 带 调制 光束 而 使 底片 感光 的 系统 ， 因 而 明显 地 改善 了 还 原 过 程 。 


D 本 书后 面 提供 的 参考 文献 按 作者 姓氏 的 字母 顺序 列 出 。 


第 1 章 绪论 3 


虽然 刚才 引用 的 例子 中 涉及 数字 图 像 ， 但 并 不 认为 它 
们 就 是 我 们 定义 的 数字 图 像 处 理 ， 因 为 创建 这 些 图 像 时 并 
未 涉及 计算 。 因 此 ， 数 字 图 像 处 理 的 历史 与 数字 计算 机 的 
发 展 密切 相关 。 事 实 上 ， 数 字 图 像 要 求 非常 大 的 存储 和 计 
算 能 力 ， 因 此 数字 图 像 处 理 领 域 的 发 展 必 须 依靠 数字 计算 
机 及 数据 存储 、 显 示 和 传输 等 相关 支撑 技术 的 发 展 。 

计算 机 的 概念 可 追溯 到 5000 多 年 前 亚洲 算盘 的 发 
明 。 更 近 一 些 ， 过 去 两 个 世纪 以 来 已 有 的 发 展 也 奠定 了 我 
pide inset art. i 然而 ， pe ge S 





图 13 美国 将 和 法 ss 


所 出 ph a) 保存 程序 和 数据 的 存储 器 ease 15 Pepi ene tery 
@O) 条 件 分 支 。 这 两 个 概念 是 中 央 处 理 单元 (CPU) 的 基 缆 传 送 的 ( 原 图 像 由 McFarlane 提供 ) 


fil, SR, 它 是 计算 机 的 心脏 。 从 冯 : 诺 依 曼 开 始 , 已 
有 的 一 系列 重要 的 进展 使 得 计算 机 强大 到 足以 用 于 数字 图 像 处 理 。 

简单 地 说 ， 这 些 进 展 可 归纳 为 如 下 几 点 : (1) 1948 年 美国 贝尔 实验 室 发 明了 晶体 管 ; (2)20 世纪 
50 年 代 和 60 年 代 高 级 编程 语言 COBOL (Common Business-Oriented Language) 及 FORTRAN (Formula 
Translator) 的 开发 ; (3) 1958 年 美国 德州 仪器 公司 发 明了 集成 电路 (IC) ; (4) 20 世纪 60 年 代 早期 操作 系 
统 的 开发 ; (5)20 世纪 70 年 代 早期 Intel 公司 开发 了 微 处 理 器 (由 中 央 处 理 单元 、 存 储 器 和 输入 /输出 控制 
组 成 的 单一 芯片 ) ; (6) 1981 年 IBM 公司 推出 了 个 人 计算 机 ; (7) 元 器 件 的 逐步 小 型 化 ， 随 着 20 世纪 70 
年 代 未 大 规模 集成 电路 (ED 开始 出 现 ，20 世纪 80 年 代 出 现 了 甚大 规模 集成 电路 (VLSID ， 今 天 出 现 了 超 
大 规模 集成 电路 (ULSD) 。 伴随 着 这 些 进展 , 数字 图 像 处 理 的 两 个 基本 需求 一 一 大 容量 存储 和 显示 系统 领 
域 也 随 之 快速 发 展 。 

第 一 台 功 能 强大 到 足以 执行 有 意义 图 像 处 理 任务 的 大 型 计算 机 出 现在 20 世 纪 60 年 代 初 。 我 们 今天 
称 之 为 数字 图 像 处 理 的 诞生 可 追溯 至 这 一 时 期 这 些 机 器 的 使 用 和 空间 项 目的 开发 。 这 两 大 发 展 一 起 把 
人 们 的 注意 力 集中 到 数字 图 像 处 理 概念 的 潜能 上 ,利用 计算 机 技术 改善 空间 探测 器 发 回 的 图 像 的 工作 ， 

台 于 1964 年 美国 加 利 福 尼 亚 的 喷气 推进 实验 室 。 当 时 由 “徘徊 者 7 号 ”卫星 传送 的 月 球 图 像 由 一 台 计 

算 机 进行 了 处 理 ， 以 校正 航天 器 上 电视 摄像 机 中 各 种 类 型 的 图 像 畸 变 。 图 1.4 显示 了 由 “徘徊 者 7 号 ” 
F 1964 年 7 月 31 日 上 午 ( 东 部 白天 时 间 )9 点 09 分 在 撞击 ES PP 
月 球 表面 前 约 17 分 钟 时 拍摄 的 第 一 张 月 球 图 像 [ 网 状 标 
记 用 于 第 2 章 讨论 的 几何 校正 ]。 这 也 是 由 美国 航天 器 拍 
摄 的 第 一 幅 月 球 图 像 。 “徘徊 者 7 号 ”积累 的 图 像 处 理 方 
法 可 作为 增强 和 复原 图 像 方法 的 基础 ， 璧 如 “探索 者 ” 登 
月 飞行 、“ 水 手 号 ”火星 飞越 任务 及 “阿波 罗 ” 载 人 登 月 和 
其 他 任务 。 

在 空间 应 用 的 同时 ， 数 字 图 像 处 理 技 术 在 20 世纪 60 年 
ARRAI 20 世纪 70 年 代 初 开 始 用 于 医学 成 像 、 地 球 资源 遥 
感 监测 和 天 文学 等 领域 。 早 在 20 世纪 70 年 代 发 明 的 计算 ”图 1.4 美国 航天 器 传 回 的 第 一 张 月 球 照片 ， 





机 轴 向 断层 术 ， 简 称 为 计算 机 断层 (CT) ， 是 图 像 处 理 在 医 它 是 由 “徘徊 者 7 号 ”探测 器 在 撞 
学 诊断 领域 最 重要 的 应 用 之 一 。 计算 机 轴 向 断层 术 是 一 种 击 月 球 表面 前 17 分 钟 于 美国 东部 
处 理 廊 法 ， 在 这 种 处 理 中 ， 检 测 咒 环 轩 绕 一 个 物体 (或 病 ee a AEDA 


人 ) ,一 个 与 该 环 同心 的 X 射 线 源 与 检测 器 环 同 ， 局 ) 线 物 分 拍摄 的 ( 原 图 像 由 NASA 提供 ) 


26 


28 


29 


4 数字 图 像 处 理 (第 三 版 ) 


体 旋 转 。X 射线 穿 过 物体 并 由 环 中 对 面 的 检测 器 进行 收集 。 当 射线 源 旋转 时 ， 重 复 这 一 过 程 。 断 层 
由 一 些 算法 组 成 ， 这 些 算法 使 用 感知 的 数据 来 重建 通过 物体 的 “切片 ”图 像 。 当 物体 沿 垂直 于 检测 
器 环 的 方向 运动 时 ， 就 产生 一 系列 这 样 的 “切片 "， 这些 切片 组 成 该 物体 内 部 的 三 维 再 现 。 断 层 摄影 
术 是 由 Godfrey N. Hounsfield 先生 和 Allan M. Cormack 教授 分 别 发 明 的 。 由 于 这 项 发 明 ， 他 们 共同 
获得 了 1979 年 的 诺 贝 尔 医学 奖 。 有 趣 的 是 , X 射线 是 1895 年 由 Wilhelm Conrad Roentgen (威廉 + HE 
拉 德 : 伦琴 ) 发 现 的 ， 由 于 这 一 发 现 ， 他 获得 了 1901 年 的 诺 贝尔 物理 学 奖 。 今 天 ， 这 两 个 时 间 上 相 
差 近 100 年 的 发 明 引领 着 图 像 处 理 的 一 些 最 重要 应 用 。 

DA 20 世纪 60 年 代 至 今 ， 图 像 处 理 领域 一 直 在 生机 勃勃 地 发 展 。 除 了 医学 和 空间 项 目 应 用 外 ， 数 
字 图 像 处 理 技术 现在 已 用 于 更 广泛 的 范围 。 计 算 机 方法 用 于 增强 对 比 度 或 将 灰 度 编码 为 彩色 ， 以 便于 
解释 工业 、 医 学 及 生物 科学 等 领域 中 的 X 射线 图 像 和 其 他 图 像 。 地 理学 者 使 用 相同 或 相似 的 技术 ,由 
航空 和 卫星 图 像 研究 污染 模式 。 图 像 增 强 和 复原 方法 用 于 处 理 不 可 修复 物体 的 退化 图 像 ， 或 太 昂贵 以 
至 于 不 可 复制 的 实验 结果 。 在 考古 学 领域 ， 使 用 图 像 处 理 方法 已 成 功 地 复原 了 模糊 的 图 片 ， 这 些 图 片 
是 丢失 或 损坏 的 稀有 物品 的 唯一 现 有 记录 。 在 物理 学 和 相关 领域 ,计算 机 技术 通常 用 于 增强 如 高 能 等 
离子 和 电子 显微镜 等 领域 的 实验 图 像 。 类 似 地 ， 图 像 处 理 技 术 也 成 功 地 应 用 在 天 文学 、 生 物 学 、 核 医 
学 、 法 律 实施 、 国 防 和 工业 领域 中 。 

这 些 例 子 说 明 图 像 处 理 的 结果 主要 用 于 人 类 解 译 。 本 章 开始 时 曾 提 到 ， 数 字 图 像 处 理 技术 的 第 二 
个 主要 应 用 领域 是 解决 机 器 感知 的 问题 。 在 这 种 情况 下 ， 兴 趣 在 于 以 更 适合 计算 机 处 理 的 形式 从 图 像 
中 提取 信息 的 过 程 。 通 常 ， 这 种 信息 类 似 于 人 类 用 于 解 译 一 幅 图 像 内 容 的 视觉 特性 。 例 如 ， 机 器 感知 
中 使 用 的 信息 类 型 的 例子 有 统计 和 矩 、 傅 里 叶 变 换 系 数 和 多 维 距 离 度量 。 在 机 器 感知 中 ,使 用 图 像 处 理 
技术 的 典型 问题 是 自动 字符 识别 、 产 品 装配 线 和 检测 的 工业 机 器 视觉 、 军 事 识别 、 指 纹 的 自动 处 理 、 
X 射线 和 血样 分 类 、 用 于 天 气 预报 和 环境 评估 的 航空 图 像 与 卫星 图 像 的 机 器 处 理 。 计 算 机 价格 性 能 比 
的 不 断 下 降 、 万 维 网 和 互联 网 规模 的 不 断 扩 张 及 网 络 通信 带宽 的 提高 ， 为 数字 图 像 处 理 技术 的 持续 发 
展 提供 了 前 所 未 有 的 机 会 。 下 一 节 中 将 说 明 某 些 这 样 的 应 用 领域 。 


1.3 ”使 用 数字 图 像 处 理 领 域 的 实例 


今天 ， 几 乎 不 存在 与 数字 图 像 处 理 无 关 的 技术 领域 。 这 里 讨论 的 范围 只 能 覆盖 其 应 用 领域 的 一 小 
部 分 。 然 而 ， 由 于 篇 幅 的 限制 ， 本 节 的 内 容 无 疑 将 围绕 数字 图 像 处 理 的 广度 和 重要 性 展开 。 本 节 将 介 
绍 一 些 应 用 领域 ， 其 中 每 个 领域 都 要 使 用 后 续 各 章 中 讲解 的 常用 数字 图 像 处 理 技术 。 本 节 中 所 示 的 许 
多 图 像 会 在 本 书后 面 给 出 的 多 个 例子 中 引用 。 显 示 的 所 有 图 像 都 是 数字 图 像 。 

数字 图 像 处 理 的 应 用 领域 多 种 多 样 ， 所 以 本 书 在 组 织 形式 上 力图 覆盖 该 技术 领域 的 广度 。 阐 述 数 
字 图 像 处 理应 用 范围 的 一 种 最 简 方法 是 , 根据 信息 源 来 分 类 (如 可 见 光 或 X 射 线 等 ) , 在 今天 的 应 用 中 ， 
最 主要 的 图 像 能 源 是 电磁 能 谱 , 其 他 主要 图 像 能 源 包括 声波 、 超 声波 和 电子 (以 用 于 电子 显微镜 中 的 电 
子 束 形式 ) 。 用 于 建 模 和 可 视 化 的 合成 图 像 由 计算 机 产生 。 本 节 简 要 讨论 如 何 生成 各 种 类 别 的 图 像 及 这 
些 图 像 适 用 的 领域 。 把 图 像 变 换 为 数字 图 像 的 方法 则 在 下 一 章 中 讨论 。 

以 电磁 波谱 辐射 为 基础 的 图 像 是 我 们 最 熟悉 的 ,特别 是 X 射线 和 可 见 光谱 波段 的 图 像 。 电 磁 波 可 
定义 为 以 各 种 波长 传播 的 正弦 波 ， 或 视 为 无 质量 的 粒子 流 ， 每 个 粒子 以 波 的 形式 传播 并 以 光 的 速度 运 
动 。 每 个 无 质量 的 粒子 包含 一 定 的 能 量 (或 一 束 能 量 ) ， 每 束 能 量 称 为 一 个 光子 。 如 果 光 谱 波 段 根据 光 
子 能 量 进行 分 组 ， 则 可 得 到 图 1.5 所 示 的 光谱 ,范围 从 伽 马 射线 (最 高 能 量 ) 到 无 线 电波 (最 低能 量 ) 。 如 
图 所 示 ， 加 底 纹 的 条 带 表明 了 这 样 一 个 事实 ， 即 电磁 波谱 的 各 个 波段 之 间 并 没有 明确 的 界线 ， 而 是 由 
一 个 波段 平滑 地 过 渡 到 另 一 个 波段 。 
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图 1.5 根据 光子 能 量 排列 的 电磁 波谱 
1.3.1 MOAR 


iE of a a 在 核 医 学 中 ， 这 种 方法 是 将 放射 性 同位 素 注 射 
到 人 体内 ， 当 这 种 物质 衰变 时 就 会 放射 出 伽 马 射线 ， 然 后 用 伽 马 射 线 检 测 仪 收集 到 的 放射 线 来 产生 图 
像 Hie (a) SRT Wee naan 导 到 的 人 体 骨 骼 扫描 图 像 。 这 类 图 像 用 于 骨骼 病变 的 定位 ， 
譬如 感染 或 肿瘤 。 图 1.6 (b) 显示 了 男 一 种 主要 形态 的 核 成 像 ， 称 为 正 电子 放 射 断层 (PET) ， 其 原理 与 
1.2 节 中 提 及 的 X 射线 断层 相同 。 然 而 ， 与 使 用 外 部 X 射线 源 不 同 ， 它 给 病人 注 和 放射性 同位 素 ， 同 
位 素 衰变 时 放射 出 正 电 子 。 正 电子 遇 到 一 个 电子 时 ， 两 者 潭 没 并 放射 出 两 束 伽 马 射线 。 检 测 到 这 些 射 
线 后 ， 就 可 利用 断层 技术 的 基本 原理 创建 断层 图 像 。 图 1.6 (b) 所 示 的 图 像 是 构成 病人 三 维 再 现 图像 序 
列 中 的 一 幅 图 像 。 这 幅 图 像 表 明 脑 部 和 肺 部 各 有 一 个 肿瘤 ， 即 很 容易 看 到 的 白色 小 团 块 。 

大 约 在 15 000 年 前 , 天 铬 星座 中 的 星球 发 生 大 爆炸 , 产生 了 一 团 过 热 的 稳定 气 云 ( 即 天 鹅 星座 环 ) , 
a 图 1.6(c) 显示 了 在 件 马 射线 波段 成 像 的 天 鹅 星座 环 。 与 图 1.6(a) 和 图 1.6 (b) 
不 同 ， 该 图 像 是 利用 被 成 像 物体 的 自然 辐射 得 到 的 。 最 后 ， 图 1.6 (d) 显示 了 一 幅 来 自 核反应 堆 真 空 管 
oaaae Een ca Same = 





图 1.6 伽 马 射 线 成 像 实例 : (a) 骨骼 扫描 图 像 ，(b)PET 图 像 ;(c) 座 环 图 像 ; (d) 来 自 反 应 堆 真空 管 的 
伽 马 辐射 (SEK) [图 (a) H G. E. Medical Systems 公司 提供 ， 图 (b) 由 CTIPET Systems 公司 的 Michael E. 
Casey tHE, El (c) H NASA 提供 ， 图 (d) 由 密歇根 ah Zhong He 和 David K.Wehe 教授 提供 | 


1.3.2 X 射线 成 像 


X 射线 是 最 早 用 于 成 像 的 电磁 辆 射 源 之 一 。 最 熟悉 的 X 射线 应 用 是 医学 诊断 , 但 是 X 射线 还 被 
广泛 用 于 工业 和 其 他 领域 ,如 天 文学 。 用 于 医学 和 工业 成 像 的 X 射线 是 由 X 射线 管 产生 的 , X 射线 
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管 是 带 有 阴极 和 阳极 的 真空 管 。 阴 极 加 热 释 放 自 由 电子 ， 这 些 电子 以 很 高 的 速度 向 阳极 流动 ， 当 电子 
撞击 一 个 原子 核 时 , 能 量 被 释放 并 形成 X 射线 辐射 。X 射线 的 能 量 由 另 一 边 的 阳极 电压 控制 , 而 X 射 
线 的 数量 由 施加 于 阴极 灯丝 的 电流 控制 。 图 1.7 (a) 显示 了 一 幅 大 家 熟悉 的 位 于 又 射线 源 和 对 又 射线 能 - 
量 敏感 的 胶片 之 间 的 病人 胸部 图 像 。X 射线 的 强度 受 射线 穿 过 病人 时 的 吸收 量 调制 ， 最 终 能 量 落 在 胶 
片上 并 使 胶片 感光 ， 这 与 光 使 得 胶片 感光 的 原理 是 一 样 的 。 在 数字 射线 照相 术 中 ， 数 字 图 像 可 用 两 种 
方法 得 到 : (1) 使 用 数字 化 的 X 射线 胶片 ; (2)X 射线 穿 过 病人 身体 后 直接 落 到 某 个 装置 上 (譬如 菊 光 
屏 ) ， 该 装置 把 X 射线 转换 为 光 信 和 号 。 然 后， 转换 而 来 的 光 信 和 号 由 高 灵敏 度 的 数字 系统 捕获 。 第 2 章 和 
第 4 章 将 详细 地 讨论 数字 化 问题 。 





图 1.7 X 射线 成 像 实例 : (a) 胸部 和 射线 图 像 ;〈b) 主动 脉 造影 图 像 ; (ec) 头 部 CT ER; (d) E 
路 板 图 像 ;(e) 天 鹅 星 座 环 图像 [图 (a) 和 图 (c) 由 Vanderbilt 大 学 医学 中 心 辐 射 学 与 放射 
学 系 的 David R. Pickens 博士 提供 ， 图 (b) 由 密歇根 大 学 医学 院 解剖 学 分 部 的 Thomas R. 
Gest 博士 提供 ， 图 (d) 由 Lixi 公司 的 Joseph E. Pascente 先生 提供 ， 图 (e) H NASA 提供 | 


血管 照相 术 是 对 比 度 增 强 辐 射 成 像 领域 中 的 男 一 个 主要 应 用 。 该 过 程 用 于 得 到 血管 的 图 像 ( 称 为 
血管 造影 照片 ) 一 根 导管 (柔软 且 中 空 的 小 管 ) 插 入 动脉 或 静脉 , 导管 穿 过 血管 并 被 引导 到 要 研究 的 区 
域 。 当 导管 到 达 所 研究 的 部 位 时 ,将 入射 线 造 影 剂 注入 导管 。 这 会 增强 血管 的 对 比 度 ， 并 可 以 让 放射 
线 学 者 观察 到 任何 病变 或 阻塞 。 图 1.7 (b) 显示 了 一 个 主动 脉 血管 造影 照片 的 例子 。 在 图 像 的 左下 方 ， 
可 以 看 到 插入 到 血管 中 的 导管 。 注 意 ， 在 图 像 中 ， 可 看 到 造影 剂 流向 肾脏 时 大 血管 的 强烈 对 比 效 果 。 
正如 第 2 章 将 要 讨论 的 那样 ， 血 管 照相 术 是 数字 图 像 处 理 的 主要 应 用 领域 ， 在 该 领域 ， 图 像 相 减 用 于 
进一步 增强 被 研究 的 血管 。 

X 射线 在 医学 成 像 中 的 另 一 个 重要 应 用 是 计算 机 轴 向 断层 (CAT) 。 由 于 该 技术 的 分 辩 率 和 三 维 能 
Ay, CAT 扫描 早 在 20 世纪 70 年 代 第 一 次 付 诸 使 用 时 就 引起 了 医疗 手段 的 革命 。 正 如 1.2 节 提 到 的 那 
样 ,每 幅 CAT 图 像 都 是 垂直 穿 过 病人 的 一 个 “切片 "， 当 病人 纵向 移动 时 可 产生 大 量 的 “切片 ”， 这 些 
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图 像 组 合 在 一 起 就 构成 了 人 体内 部 的 三 维 描 绘图 像 ， 其 纵向 分 辨 率 与 切片 数量 成 正比 。 图 1.7(c) 显示 


了 一 幅 典 型 的 头 部 CAT 切片 图 像 。 

与 刚刚 讨论 的 有 些 类 似 的 技术 也 可 用 于 工业 处 理 ， 但 通常 使 用 的 是 更 高 能 量 的 和 射线 。 图 1.7(d) 
显示 了 一 块 电路 板 的 驻 射 线 图 像 s 这 样 的 图 像 是 X 射线 在 上 百 种 典型 工业 应 用 中 的 代表 性 图 像 , 用 于 
令 测 电路 板 中 的 制造 缺陷 ， 如 元 件 缺 失 或 断 线 等 。 当 元 件 可 被 XX 射 线 穿 透 时 ，CAT 扫描 很 有 用 ， 辟 如 


塑料 元 件 ， 甚 至 更 大 的 物体 ， 如 固体 推进 剂 火箭 发 动机 。 图 1.7(e) 显示 了 天 文学 中 X 射线 成 像 的 一 个 
例子 。 这 幅 图 像 是 图 1.6(c) PIRRE, BIE X 射线 波段 成 像 。 


1.3.3 ”紫外 波段 成 像 


紫外 “ 光 ” 的 应 用 多 种 多 样 ， 包 括 平板 印刷 术 、 工 业 检 测 、 显 微 方法 、 激 光 、 生 物 成 像 和 天 文 观 
测 等 。 我 们 仅 用 显 微 方法 和 天 文 观测 作为 例子 来 说 明 这 一 波段 的 成 像 。 

紫外 光 用 于 奖 光 显 微 方法 中 ， 这 是 显 微 方法 中 发 展 最 快 的 领域 之 一 。 获 光 是 在 19 世纪 中 叶 发 现 
的 一 种 现象 。 当 时 ， 当 紫外 光 直 接 照 射 到 矿物 质 上 时 ， 首 次 发 现 了 萤 石 发 出 的 荧光 。 紫 外 光 本 身 并 不 
可 见 ， 但 当 紫 外 辐射 光子 与 荧光 材料 内 原子 中 的 电子 碰撞 时 ， 它 把 电子 提高 到 较 高 的 能 级 ， 随 后 受 
激 电 子 释放 到 较 低 的 能 级 ， 并 以 可 见 光 范围 内 的 低能 光子 形式 发 光 。 荧 光 显 微 方法 的 基本 任务 是 用 
激发 光照 射 一 个 样品 ， 然 后 从 较 强 的 激发 光 中 分 离 出 较 弱 的 荧光 ， 这 样 ， 仅 有 辐射 光 到 达 人 有 眼 或 其 
他 检测 右 ， 以 允许 检测 足够 的 对 比 度 而 得 到 照射 在 暗 背 景 上 的 荧光 区 。 非 奖 光 材料 的 背景 越 暗 ， 设 
备 越 有 效 。 

荧光 显 微 方法 在 研究 可 产生 欧 光 的 材料 时 ， 的 确 是 一 种 很 优秀 的 方法 ， 无 论 是 以 它们 的 自然 形式 
( 原 发 荧光 ) , 还 是 经 化 学 处 理 后 具有 荧光 能 力 (次 生 菊 光 ) 。 图 1.8 (a) 和 图 1.8 (b) 显示 了 使 用 荧光 显 微 方 
法 所 得 到 的 典型 结果 。 图 1.8(a) 显示 了 普通 玉米 的 荧光 显 微 图 像 , 图 1.8 (b) 显示 了 被 一 种 谷类 疾病 “ 黑 
穗 病 ”感染 了 的 玉米 图 像 ， 黑 穗 病 是 草 、 洋 葱 、 高 粱 等 被 700 多 种 寄生 真菌 感染 后 出 现 的 病害 。 玉 米 
黑 穗 病 是 一 种 严重 的 病害 ， 因 为 玉米 是 世界 上 最 主要 的 食品 来 源 之 一 。 图 1.8 (c) 显示 了 在 紫外 波段 的 
高 能 区 域 成 像 的 天 鹅 星座 环 。 

abci g 





图 1.8 紫外 光 成 像 实 例 : (a) 普 通 玉 米 图 像 ，(b) 患 黑 穗 病 的 玉米 图 像 ;(c) RRS SAE AB 
[图 (a) 和 图 (b) 由 佛罗里达 州立 大 学 的 Michael W. Davidson 博士 提供 ， 图 (c) H NASA 提供 ] 


1.3.4 可 见 光 及 红外 波段 成 像 


由 于 电磁 波谱 可 见 光 波段 在 所 有 波段 中 是 我 们 最 熟悉 的 ， 因 此 这 一 波段 的 成 像 应 用 领域 远 远 超 
”过 其 他 波段 的 成 像 应 用 领域 。 红 外 波段 常用 于 与 可 见 光 相 结合 成 像 ， 为 便于 说 明 ， 本 节 把 可 见 光 和 
红外 光合 并 在 一 起 讨论 。 下 面 的 讨论 将 涉及 光 显 微 方法 、 天 文学 、 遥 感 、 工 业 和 法 律 实施 等 方面 的 | 
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图 1.9 显 示 了 一 些 用 可 见 光 显 微 技术 得 到 的 图 像 。 这 些 例子 涵盖 了 从 制药 和 微 检测 到 材料 特征 的 范 
围 。 甚 至 仅 在 显 微 方法 中 ， 其 应 用 领域 如 此 之 多 ， 以 至 于 不 能 在 这 里 详细 列 出 。 当 然 ， 把 这 些 图 像 用 
于 从 增强 到 测量 这 些 范 围 可 能 并 不 困难 。 





F l | mr iS lo Th PA pcde T 

图 1.9 光 显 微 镜 图 像 实例 : (a) 已 放大 250 WAZ GOA) ; (\b) 已 放大 40 NA; (c) Baie 
大 60 倍 的 微 处 理 器 ; (d) 已 放大 600 倍 的 镍 氧化 物 胶片 ; (e) 已 放大 1750 售 的 音频 CD 表面 ; 
人 已 放大 450 倍 的 有 机 超导体 (这 些 图 像 由 佛罗里达 州立 大 学 的 Michael W. Davidson 博士 提供 ) 

可 见 光 处 理 的 另 一 个 主要 应 用 领域 是 遥感 ， 遥 感 通 和 常 包括 可 见 光 和 红外 波谱 范围 的 一 些 波段 。 表 1.1 
显示 了 NASA 的 LANDSAT 卫星 中 的 主要 波段 。LANDSAT 卫星 的 主要 功能 是 从 空间 获得 并 传送 地 球 
的 图 像 ， 目 的 是 监测 地 球 的 环境 条 件 。 波 段 用 波长 来 表示 ，1 hm 等 于 10° m (我 们 讨论 的 是 电磁 波谱 
的 波长 范围 ， 第 2 章 将 详细 讨论 ) 。 注 意 表 1.1 中 每 个 波段 的 特征 与 用 途 。 

为 了 阐述 这 类 多 光谱 成 像 的 基本 性 能 , 考虑 图 1.10, 它 为 表 1.1 中 的 每 个 频谱 波段 显示 了 一 幅 图 像 。 
成 像 区域 是 美国 华盛顿 特区 ， 包 括 建筑 物 、 道 路 、 植 被 和 穿 过 城市 的 主要 河流 ( 波 拖 马 可 河 ) 等 特征 。 
人 口中 心地 区 的 图 像 常 被 用 来 评估 人 口 增长 和 变迁 方式 、 污 染 及 其 他 有 害 环境 的 因素 。 可 见 光 和 红外 
光 特 征 之 间 的 区 别 在 这 些 图 像 中 十 分 明显 。 例 如 ， 在 波段 4 和 波段 5 中 ， 从 其 周围 环境 可 以 看 出 如 何 
较 好 地 界定 河流 。 

表 1.1 NASA ġġ LANDSAT 卫星 的 主要 波段 





波段 号 名 称 波长 (hm) 特征 和 用 途 
1 可 见 蓝 光 0.45~0.52 对 水 体 有 最 大 的 穿 透 性 
2 可 见 绿 光 0.52-0.60 适用 于 度量 植物 活力 
3 可 见 红 光 0.63~0.69 植被 辨别 
4 近 红 外 光 0.76-0.90 生物 团 和 海岸 线 测绘 
5 中 红外 光 1.55~1.75 土壤 和 植被 含水 量 
6 热 红 外 光 10.4~12.5 土壤 温度 ， 热 量 测绘 
7 中 红外 光 2.08~2.35 矿物 测绘 
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图 1.10 ”美国 华盛顿 特区 的 LANDSAT 卫星 图 像 。 图 中 的 数字 与 表 1.1 中 的 波段 号 对 应 (图 像 由 NASA 提供 ) 


天 气 观 测 与 预报 也 是 卫星 多 光谱 成 像 的 主要 应 用 领 
域 。 例 如 ， 图 1.11 是 由 美国 国家 海洋 和 大 气管 理 (NOAA) 
卫星 在 可 见 光 及 红外 波段 使 用 传感器 拍摄 的 飓风 图 像 , 图 
像 中 的 飓风 眼 清 晰 可 见 。 

图 1.12 和 图 1.13 显示 了 红外 成 像 的 一 个 应 用 。 这 些 图 
像 是 “全 球 夜间 灯光 ”数据 集 的 一 部 分 ， 它 可 以 提供 全 球 
人 类 居住 区 的 汇总 情况 。 图 像 是 由 安装 在 NOAA 
DMSP (防卫 气象 卫星 计划 ) 卫星 上 的 红外 成 像 系统 生成 À 
的 。 红 外 成 像 系 统 工作 于 10.0~13.4 hm 波段 , 具有 独特 的 111 2005 年 8 月 29 日 拍摄 的 “卡特 里 娜 ” 
功能 ， 可 观察 地 球 表面 微弱 的 接近 可 见 光 的 近 红 外 发 射 RH TERNS (图像 由 NOAA 提供 ) 





光 ， 包 括 城市 、 小 镇 、 村 庄 、 气 体 火焰 及 火光 。 即 使 在 图 像 处 理 方面 没有 正式 地 训练 过 ， 编 写 一 个 计 


算 机 程序 ， 用 这 些 图 像 来 估计 世界 不 同 地 区 使 用 电能 的 百分比 也 并 不 困难 
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图 1.12 美洲 的 红外 卫星 图 像 。 小 灰色 图 图 1.13 世界 居住 区 的 红外 卫星 图 像 。 小 灰 
仅 供 参考 (图 像 由 NOAA 提供 ) 色 图 仅 供 参考 (图 像 由 NOAA 提供 ) 









可 见 光 谱 中 的 一 个 主要 成 像 领域 是 生产 产品 的 自动 视觉 检测 。 图 1.14 显示 了 一 些 例子 。 图 1.14(a) 
是 CD-ROM 驱动 器 的 一 个 控制 板 。 对 这 类 产品 的 一 种 典型 图 像 处理 任 务 是 检测 丢失 的 部 件 ( 图 像 右上 
fa 1/4 处 的 黑色 方块 是 一 个 丢失 部 件 的 例子 ) 。 图 1.14(b) 是 药丸 胶 圳 的 图 像 , 这 里 的 目标 是 用 机 器 寻找 
缺失 的 药丸 。 图 1.14 (0) 显示 了 一 种 应 用 , 在 该 应 用 中 ,图像 处 理 技术 用 来 寻找 未 装 满 到 要 求 液 位 的 瓶 
了 。 图 1.14 (d) 显示 了 一 个 清澈 的 塑料 部 件 ， 部 件 内 带 有 不 可 接受 数量 的 气泡 。 这 些 异 常 检测 是 工业 检 
测 的 主 骨 ， 这 类 检测 也 涉及 其 化 产品 ， 如 木材 和 布匹 。 图 1.14(e) 显示 了 一 批 谷 物 ， 通 过 颜色 和 存在 的 
异常 (如 变 :时 的 小 片 ) 等 进行 检测 。 最 后 ， 图 1.14 反 显示 了 一 幅 含 有 挫 杂 物 的 目镜 图 像 ( 位 于 人 眼 处 的 
镜头 ) ,使 用 了 一 种 “结构 光 ” 照 明 技术 加 以 突出 ， 以 便 更 容易 检测 平面 镜头 中 心 处 出 现 的 镜头 畸变 
在 类 似 钟表 表盘 的 1 点 和 5 点 处 的 刻 痕 是 osei n 而 其 他 的 多 数 小 斑点 则 是 残片 。 这 类 检 
测 的 目标 是 在 包装 之 前 自动 找 出 损坏 的 或 未 正确 加 工 的 装 

作为 可 见 光谱 中 图 像 处理 的 最 后 说 明 ， 考 虑 图 1.15。 =e eee ae 指纹 图 
像 通常 由 计算 机 处 理 ， 该 处 理 不 是 增强 指纹 图 像 就 是 寻找 特征 ， 以 便 自 动 搜 索 数据 库 ， 寻 找 潜在 的 匹 
配 。 图 1.15(b) 显 示 了 -一 幅 纸币 图 像 数字 图 像 处 理 在 该 领域 的 应 用 包括 自动 计数 、 法 律 实施 、 为 
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追踪 和 鉴别 钱币 读 取 序 列 号 等 。 图 1.15 (c) 和 图 1.15 (d) 所 示 的 两 幅 汽 车 图 像 是 自动 读 取 车 牌 的 例子 。 
明亮 的 矩形 指示 成 像 系 统 检测 车 牌 的 区 域 。 黑 色 矩 形 显示 了 系统 自动 读 取 和 车牌 内 容 后 的 结果 。 车 牌 和 
其 他 字符 识别 广泛 用 于 交通 监测 和 监视 中 





图 1.14 ”使 用 数字 图 像 处 理 技术 检查 产品 的 一 些 例子 : ”图 1.15 ”可见光 谱 成 像 的 其 他 几 个 例子 : (a) 拇 指 指纹 图 


(a) 一 块 电路 板 控 制 器 图 像 ，(b) 封 装 的 药丸 fZ: ORTE: (c)~(d) 自动 读 取 车 牌 图 像 
图 像 ; (OTEN: (d) 清澈 的 塑料 产品 中 的 [图 (@) 由 美国 国家 标准 与 技术 研究 所 提供 ,图 (c) 
气泡 图 像 ;(e) 谷物 图 像 ， (目镜 的 杂 物 图 像 和 图 (d) 由 Perceptics 公司 的 Juan Herrera 博士 提供 


[图 的 由 Perceptics 公司 的 Pete Sites 先生 提供 | 

1.3.5 ”微波 波段 成 像 

微波 波段 成 像 的 典型 应 用 是 雷达 。 成 像 雷达 的 独特 之 处 是 在 任何 范围 和 任何 时 间 内 , 不 考虑 气候 、 
周围 光照 条 件 都 可 收集 数据 的 能 力 。 某 些 雷达 波 可 以 穿 透 去 层 ， 在 一 定 条 件 下 还 可 以 穿 透 植被 、 冰 层 
和 极 干燥 的 沙漠 。 在 许多 情况 下 ， 雷 达 是 探测 地 球 表面 不 可 接近 地 区 的 唯一 方法 。 成 像 雷 达 的 工作 原 
理 就 像 一 台 闪 光照 相机 ， 它 自己 提供 照明 (微波 脉冲 ) 去 照 
亮 地 面 上 的 一 个 区 域 ， 并 得 到 一 幅 快 照 图 像 。 与 照相 机 镜 
头 不 同 ， 雷 达 使 用 天 线 和 数字 计算 机 记录 图 像 。 在 雷达 图 
像 中 ， 能 看 到 的 只 是 反射 到 雷达 天 线 的 微波 能 量 。 

图 1.16 显示 了 一 幅 西 藏 东南 方 高 低 不 平山 区 的 星 载 雷 
达 图 像 ， 拉 萨 市 约 在 东边 90 km 处 ， 右 下 角 是 广阔 的 拉萨 Beg 
河谷 ， 这 是 西藏 农民 和 牧民 包括 曼 巴 居住 的 地 方 。 这 一 地 A 
区 的 山峰 海拔 高 度 约 为 5800 m， 其 谷底 位 于 海拔 4300 m a 
处 。 注 意 ， 图 像 的 清晰 度 和 细节 未 被 云层 及 其 他 大 气 条 件 图 1.16 "西藏 东南 部 山区 的 星 载 震 达 
阻挡 ， 通 常 这 些 因素 在 可 见 光波 段 会 影响 图 像 。 Bee OENE H NASA 提供) 


1.3.6 ”无线 电波 段 成 像 


正 像 波谱 另 一 端 ( 伽 马 射线 ) 的 成 像 情 况 那样 ， 无 线 电波 段 成 像 主要 应 用 于 医学 和 天 文学 。 在 医学 
y| 中 ， 无 线 电波 用 于 核磁 共振 成 像 (MRD 。 该 技术 是 把 病人 放 在 强 磁 场 中 ， 并 让 无 线 电波 短 脉冲 通过 





第 1 章 绪 论 11 


病人 的 身体 ， 每 个 脉冲 将 导致 由 病人 的 组 织 发 射 的 无 线 电 响应 脉冲 ， 这 些 信号 发 生 的 位 置 和 强度 由 计 
算 机 确定 ， 从 而 产生 病人 的 一 幅 二 维 谢 面 图 像 。MRI 可 以 在 任何 平面 产生 图 像 。 图 1.17 显 示 了 人 的 膝 
ae AEP REA ER. 





图 1.17 人 的 MRI 图 像 : (a) 膝盖 图 像 ; (b) FRE [A (a) HEARRE EY Thomas R. 
Gest 博士 提供 ， 图 (b) 由 Vanderbilt 大 学 医学 中 心 辐 射 学 与 放射 学 系 的 David R. Pickens 博士 提供 | 


图 1.18 最 右边 的 图 像 显 示 了 无 线 电波 段 的 蟹 状 脉冲 星 (Crab Pulsar) 图 像 ， 为 了 进行 有 意义 的 比较 ， 
dn 仑 的 一 些 波段 拍摄 的 相同 区 域 的 图 像 。 注 意 ， 每 幅 图 像 都 给 出 了 完全 不 同 的 脉冲 
“视图 ”。 





mn X 射 线 


红外 l 无 线 电波 
图 1.18 ”和 覆 羡 电磁 波谱 的 (位 于 图 像 中 心 的 ) 拨 状 脉冲 星 图 像 (图像 由 NASA 提供 ) 


1.3.7 ”使 用 其 他 成 像 方 式 的 例子 


虽然 电磁 波谱 成 像 一 直 占 主导 地 位 ,但 大 量 的 其 他 成 像 方式 也 很 重要 。 特 别 地 ， 本 节 讨 论 声波 成 
像 、 电 子 显 微 方法 和 (由 计算 机 产生 的 ) 合 成 成 像 。 

利用 “声音 ”成 像 在 地 质 勘 探 、 工 业 和 医学 中 得 到 了 应 用 。 地 质 应 用 采用 的 是 声 谱 中 的 低 端 声波 
( 儿 百 赫兹 ) ， 其 他 应 用 领域 的 成 像 使 用 超声 波 ( 百 万 赫兹 ) 。 图 像 处 理 在 地 质 中 的 最 重要 商业 应 用 是 矿 
产 和 石油 勘探 。 为 了 透 过 地 表 获 取 图 像 ， 主 要 方法 之 一 是 利用 一 辆 大 型 卡车 和 一 块 大 钢板 ， 钢 板 由 卡 
车 压 在 地 面 上 , 同时 卡车 以 100 Hz 的 频率 振动 。 返回 声波 的 强度 和 速度 由 地 表 下 面 的 成 分 决定 。 这些 
声波 经 过 计算 机 分 析 后 ， 可 由 分 析 结 果 生 成 图 像 

为 了 从 海洋 获取 图 像 ， 能 源 通 常 由 两 个 位 于 船 后 部 的 气枪 组 成 。 返 回 的 声波 由 置 于 船 后 部 电缆 中 
的 水 听 融 检测 ， 电 线 要 么 放置 在 海底 ， 要 么 用 浮标 巧 吊牌 直 电缆 ) 。 两 把 气枪 交替 加 压 至 约 2000 磅 / 
平方 英寸 ， 然 后 快速 释放 压力 。 船 的 匀速 运动 提供 横向 运动 ， 这 种 横向 运动 与 返回 的 声波 一 起 产生 一 
幅 海洋 底 部 地 下 的 合成 三 维 图 像 。 

图 1.19 显示 了 一 个 著名 三 维 模型 的 剖面 图 像 ， 与 此 图 像 对 照 ， 测 试 地 震 成 像 算法 的 性 能 。 箭 头 指 
， 向 碳 所 化合物 ( 油 或 气 ) 的 油气 阱 。 这 一 目标 比 周 围 地 层 明 亮 ， 因 为 目标 区 域内 的 密度 变化 较 大 。 地 震 
解释 人 员 寻 找 这 些 亮点 来 发 现 油气 。 上 面 的 地 层 也 是 亮 的 , 但 其 亮度 变化 不 像 对 面 地 层 的 亮度 那样 强 
许多 地 震 重建 算法 由 于 以 上 缺点 使 得 对 该 目标 成 像 比较 困难 
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虽然 超声 波 成 像 常用 于 制造 业 , 但 
这 一 技术 最 为 熟知 的 应 用 是 在 医学 领 
域 , 特别 是 妇 产 科 。 在 妇 产 科 ， 医生 对 
未 出 生 的 胎儿 成 像 , 以 确定 其 发 育 的 健 = 
康 状况 。 这 一 检测 的 副产品 是 确定 胎儿 LEER 
的 性 别 。 超 声波 图 像 是 利用 下 面 的 基本 ”图 1.19 地震 模型 的 剖面 图 像 。 箭 头 指 疝 碳 氨 化合物 〈 油 或 气 ) 的 油气 
步骤 生成 的 ; 阱 (图 像 由 美国 Sandia 国家 实验 室 的 Curtis Ober 博士 提供 ) 


1. 超声 波 系 统 (一 台 计 算 机 、 由 超声 波源 和 接收 器 组 成 的 超声 波 探头 及 一 台 显 示 器 ) 向 人 体 发 射 

高 频 (1~5 MHz) 声波 脉冲 。 

声波 传人 体内 并 碰撞 组 织 间 的 边界 (举例 来 说 ， 就 是 流体 和 软组织 之 间 的 边界 ， 及 软组织 和 骨 

骼 之 间 的 边界 ) 。 一 部 分 声波 反射 回 探头 ; 一 部 分 声波 则 继续 传播 ， 直 到 它们 到 达 男 一 个 边界 

并 被 反射 

3. 反射 波 被 探头 拾取 并 传 给 计算 机 。 

4. 计算 机 根据 声波 在 组 织 中 的 传播 速度 (1540 m/s) 和 每 个 回 波 的 返回 时 间 , 计算 从 探头 到 组 织 或 
器 官 边界 的 距离 

5. 系统 在 屏幕 上 显示 回 波 的 距离 和 亮度 ， 形 成 一 幅 二 维 图 像 。 


在 典型 的 超声 波 成 像 中 ， 每 秒 有 上 百 万 个 脉冲 与 回 波 发 出 和 接收 。 探 头 可 治 身 体 表面 以 不 同 角度 
运动 ， 以 便 得 到 各 种 观察 图 像 。 图 1.20 显 示 了 几 个 例子 。 





N 





图 1.20 超声 波 成 像 示例 : (a) 胎儿 图 像 ;(b) 胎儿 的 另 一 幅 观察 图 像 ; (c) 甲状 腺 图 像 ;(d) 有 
损伤 的 肌肉 层 图 像 ( 原 图 像 由 Siemems Medical Systems 公司 的 Ultrasound Group 提供 ) 


我 们 继续 使 用 电子 显 微 方法 的 某 些 例子 来 讨 ; sem es 电子 显微镜 的 功能 与 光学 显微镜 一 样 ， 
只 不 过 是 用 一 个 聚焦 的 电子 波束 代替 光束 形成 图 像 标 本 。 电 子 显微镜 的 操作 包括 下 面 几 个 基本 步骤 
由 电子 源 产 生 一 个 电子 流 ， 用 正 电 势 朝 着 标本 加 速 。 er 属 小 孔 和 电磁 透镜 限制 并 聚焦 为 细 
的 单 色 波 束 。 然 后 使 用 一 个 磁 透 镜 将 单 色 电 子 束 聚 焦 到 样本 上 。 在 样本 内 部 产生 交互 
束 。 这 些 交互 作用 和 影响 被 检测 并 转换 为 一 幅 图 像 ， 这 种 方式 与 光 被 物体 反射 或 吸收 的 方式 一 样 。 
有 电子 显微镜 均 执 行 这 些 基本 步 又。 

透射 电子 显微镜 (TEM) 的 工作 原理 很 像 一 台 幻 灯 片 投影 仪 ,投影 仪 发 射出 一 束 透 过 幻灯 片 的 光 ; 
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当 光 通过 幻灯 片 时 ， 它 由 幻灯 片 的 内 容 调节 。 这 一 发 射出 的 光束 然后 被 投射 到 观察 屏 上 ， 形 成 幻灯 
片 的 放大 图 像 。 除 了 发 射 的 是 通过 样本 (相当 于 幻灯 片 ) 的 电子 束 外 ，TEM 以 相同 的 方式 工作 。 穿 过 
样本 的 部 分 电子 束 被 投射 到 荧光 屏 上 ， 而 电子 与 荧光 物质 的 相互 作用 就 产生 了 光 ， 从 而 得 到 可 观察 的 
图 像 。 另 一 方面 ， 扫 描 电 子 显 微 镜 (SEM) 实际 上 扫描 电子 束 并 记录 每 一 位 置 上 电子 束 与 样本 的 相互 作 
用 。 这 会 在 荧光 屏 上 产生 一 个 点 。 一 幅 完 整 的 图 像 由 通过 样本 的 电子 束 光栅 扫描 形成 ,这 非常 像 电视 
摄像 机 。 电 子 与 荧光 屏 相 互 作用 并 产生 光 。SEM 适合 于 “大 块 ”样品 ， 而 TEM 要 求 非常 薄 的 样品 。 

电子 显微镜 有 非常 高 的 放大 能 力 。 光 学 显微镜 的 放大 倍数 限制 在 1000 左右 ， 电 子 显微镜 的 放大 
倍数 可 达 10 000 或 更 大 。 图 1.21 显示 了 两 幅 由 于 过 热 而 造成 损坏 的 样本 图 像 。 





< pa ab 
图 1.21 (a) 因 过 热 而 损坏 的 钨 丝 放大 250 倍 的 SEM 图 像 (注意 左下 方 的 碎片 ) ; (b) 已 损坏 集成 电 
路 的 2500 47% SEM 图 像 。 白 色 纤 维 是 由 热 破 坏 造成 氧化 的 结果 [ 图 (a) 由 俄 勒 罗 大 学 地 质 
科学 系 的 Michael Shaffer 先生 提供 ， 图 (b) 由 加 拿 大 McMaster 大 学 的 工 M. Hudak 博士 提供 ] 


下 面 通过 简略 浏览 一 些 图 像 来 结束 对 成 像 模 式 的 讨论 ， 这 些 图 像 不 是 来 自 物理 对 象 ， 而 是 用 计算 
机 产生 的 。 分 形 是 由 计算 机 生成 图 像 的 显著 例子 (Lu[1997]) 。 基 本 上 ， 分形 不 过 是 一 种 根据 某 些 数学 
规则 进行 迭代 复制 的 基本 模式 。 例 如 ,“ 拼 贴 ”是 产生 分 形 图 像 的 最 简 方 法 之 一 。 一 个 方块 可 细 分 为 4 
个 小 方块 ， 每 个 小 方块 又 可 进一步 细 分 为 4 个 更 小 的 方块 ， 等 等 。 为 了 填充 每 个 小 方块 ， 根 据 规则 的 
复杂 性 ， 一 些 漂 亮 的 瓷砖 图 像 可 用 这 一 方法 产生 。 当 然 ， 几 何 形 状 可 以 是 任意 的 。 例 如 ， 分 形 图 像 可 
以 从 一 个 中 心 点 向 外 辐射 生长 。 图 1.22 (a) 显示 了 使 用 这 种 方法 生成 的 分 形 图 像 。 图 1.22 (b) 显示 了 为 一 
幅 分 形 图 像 (“ 月 球 表面 ”) ， 它 有 趣 地 模拟 了 前 述 章节 所 用 过 的 空间 图 像 。 


bcd 





图 122 “(a)~(b) 分 形 图 像 ;(e)~(q) 由 所 示 物 体 的 三 维 计算 机 模型 生成 的 图 像 [图 (a) 和 图 (b) 
由 Swarthmore 学 院 的 Melissa D. Binde 先生 提供 ， 图 ec) 和 图 (d) h NASA 提供 ] 


分 形 图 像 由 具有 某 种 规则 的 子 图 像 元 素 生长 的 数学 公式 表示 ， 并 朝 艺 术 性 方向 发 展 。 它 们 有 时 
会 用 做 随机 纹理 。 借 助 于 计算 机 生成 更 结构 化 的 图 像 依赖 于 三 维 建 模 。 三 维 建 模 是 图 像 处 理 和 计算 
机 图 形 学 的 交叉 领域 ， 也 是 许多 三 维 可 视 化 系统 (如 光 模 拟 器 ) 的 基础 。 图 1.22 (c) 和 图 1.22 (d) 显示 
了 计算 机 生成 的 图 像 例子 。 因 为 原始 物体 是 以 三 维 方式 创建 的 ， 所 以 可 以 在 任何 角度 由 三 维 物 体 的 
平面 投影 来 生成 图 像 。 这 种 类 型 的 图 像 可 用 于 医学 培训 及 其 他 主要 应 用 ， 如 刑事 法 庭 和 需要 产生 特 
效 的 场合 。 
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1.4 数字 图 像 处 理 的 基本 步骤 


把 后 续 各 章 涉及 的 内 容 划分 为 1.1 节 定 义 的 两 个 主要 类 别 是 有 帮助 的 : 一 类 是 其 输入 和 输出 都 是 
图 像 ; 另 一 类 是 其 输入 可 能 是 图 像 但 输出 是 从 这 些 图 像 中 提取 的 属性 。 这 种 组 织 结构 总 结 于 图 1.23 中 。 
该 图 并 不 意味 着 每 种 处 理 都 用 于 图 像 。 相 反 ， 目 的 是 给 出 所 有 方法 的 概念 , 这些 方 法 可 以 针对 不 同 的 目 
的 、 不 同 的 目标 运用 于 图 像 。 这 一 节 的 讨论 也 可 视 为 本 书 其 余部 分 内 容 的 综述 。 

这 些 处 理 的 输出 通常 为 图 像 











这 些 处 理 的 输出 通常 为 图 像 属性 








图 1.23 ”数字 图 像 处 理 的 基本 步骤 方 框 中 指出 的 章 号 是 方 框 中 讨论 内 容 的 位 置 


图 像 获取 是 图 1.23 中 的 第 一 步 处 理 。1.3 节 的 讨论 给 出 了 关于 数字 图 像 起 源 的 一 些 提 示 。 这 个 主 
题 在 第 2 章 中 将 更 具体 地 进行 研究 ， 这 一 章 还 要 介绍 一 些 贯 穿 全 书 的 基本 数字 图 像 的 概念 。 注 意 ， 图 
像 获 取 与 给 出 一 幅 数 字形 式 的 图 像 一 样 简单 。 通 常 ， 图 像 获 取 阶 段 包 括 图 像 预 处 理 ， 壁 如 图 像 缩 放 。 

图 像 增强 是 对 一 幅 图 像 进 行 某 种 操作 ， 使 其 结果 在 特定 应 用 中 比 原始 图 像 更 适合 进行 处 理 。 特 定 
一 词 在 这 里 很 重要 ， 因 为 一 开始 增强 技术 就 建立 在 面向 问题 的 基础 之 上 。 例如 ， 对 增强 XX 射线 图 像 十 
分 有 用 的 方法 ， 对 增强 电磁 波谱 中 红外 波段 获取 的 卫星 图 像 可 能 就 不 是 最 好 的 方法 。 

不 存在 增强 图 像 的 通用 “理论 ”。 当 为 视觉 解释 而 处 理 一 幅 图 像 时 ， 观 察 者 就 是 特殊 方法 工作 好 
坏 的 最 终 裁判 者 。 增 强 技术 是 如 此 多 种 多 样 ， 以 至 于 有 众多 不 同 的 图 像 处 理 方法 ， 因 此 在 没有 广泛 背 
景 介绍 的 情况 下 ， 在 一 章 中 组 织 出 适合 于 增强 技术 的 有 意义 主体 是 很 困难 的 。 基 于 这 个 原因 ， 也 基于 
图 像 处 理 领域 的 初学 者 通常 看 到 图 像 增 强 应 用 在 视觉 上 是 很 吸引 人 人 的、 有趣 且 理解 起 来 相对 简单 的 原 
Al, 在 第 2 章 、 第 3 章 和 第 4 章 中 介绍 新 概念 时 ， 我 们 都 会 以 图 像 增强 作为 例子 。 后 两 章 中 的 内 容 涉 
及 许多 用 于 增强 图 像 的 传统 方法 。 因 此 , 使 用 图 像 增强 的 例子 来 介绍 前 面 章 节 阐 述 的 新 图 像 处 理 方法 ， 
不 仅 可 节省 本 书 处 理 图 像 增强 的 额外 章节 ， 而 且 更 重要 的 是 ， 可 有 效 地 向 初学 者 介绍 本 书 早期 处 理 技 
术 的 细节 。 然 而 ， 如 本 书 中 其 他 内 容 所 述 的 那样 ， 这 些 章节 阐述 的 内 容 可 应 用 于 比 图 像 增强 宽泛 得 多 
的 问题 。 

图 像 复原 也 是 改进 图 像 外 观 的 一 个 处 理 领 域 。 然 而 ， 与 图 像 增强 不 同 ， 图 像 增强 是 主观 的 ， 而 图 
像 复原 是 客观 的 ; 在 某 种 意义 上 说 , 复原 技术 倾向 于 以 图 像 退化 的 数学 或 概率 模型 为 基础 。 另 一 方面 ， 
增强 以 什么 是 好 的 增强 效果 这 种 主观 偏爱 为 基础 。 

彩色 图 像 处 理 已 成 为 一 个 重要 领域 ， 因 为 互联 网 上 数字 图 像 的 使 用 正在 不 断 增 长 。 第 6 章 涵盖 
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了 许多 彩色 模型 和 数字 域 彩色 处 理 的 基本 概念 。 在 后 续 各 章 中 ， 彩 色 也 是 提取 图 像 中 感 兴趣 特征 的 
基础 。 

小 波 是 以 不 同 分 辩 率 来 描述 图 像 的 基础 。 特 别 地 ， 本 书 中 为 图 像 数据 压缩 和 人 金字塔 表示 使 用 了 小 
波 ， 此 时 图 像 被 成 功 地 细 分 为 较 小 的 区 域 。 

正如 其 名 称 指出 的 那样 ， 压 缩 指 的 是 减少 图 像 存储 量 或 降低 传输 图 像 带宽 的 处 理 。 虽 然 存储 技术 
在 过 去 的 10 年 里 已 有 明显 改进 , 但 对 于 传输 能 力 我 们 还 不 能 这 样 说 。 互联 网 上 的 应 用 更 是 如 此 , 因为 
互联 网 是 以 大 量 图 片 内 容 为 特征 的 。 多 数 计算 机 用 户 都 很 熟悉 (也许 并 未 注意 ) 图 像 压缩 所 用 的 图 像 文 
件 扩展 名 ， 如 卫 G 文件 扩展 名 用 于 JPEG (联合 图 片 专家 组 ) 图像 压 缩 标准 。 

形态 学 处 理 涉及 提取 图 像 成 分 的 工具 , 这 些 成 分 在 表示 和 描述 形状 方面 很 有 用 。 正 如 1.1 节 所 指出 
的 那样 ， 这 一 章 的 内 容 将 从 输出 图 像 处 理 到 输出 图 像 属 性 处 理 的 转换 开始 。 

分 割 过 程 将 一 幅 图 像 划 分 为 其 组 成 部 分 或 目标 。 通 常 ， 自 动 分 割 是 数字 图 像 处 理 中 最 困难 的 任务 
之 一 。 成 功 地 把 目标 逐一 识别 出 来 是 一 个 艰难 的 分 割 过 程 。 另 一 方面 ， 很 弱 且 不 稳定 的 分 割 算法 几乎 
总 是 会 导致 最 终 失败 。 通 常 ， 分 割 越 准 确 ， 识 别 越 成 功 。 

表示 与 描述 几乎 总 是 在 分 割 阶段 的 输出 之 后 ， 通 常 这 一 输出 是 未 加 工 的 像素 数据 ， 这 些 数据 不 是 
构成 一 个 区 域 的 边界 ( 即 分 隔 一 个 图 像 区 域 与 另 一 个 图 像 区 域 的 像素 集合 ) ， 就 是 构成 该 区 域 本 身 的 所 
有 点 。 无 论 哪 种 情况 ， 把 数据 转换 成 适合 计算 机 处 理 的 形式 都 是 必要 的 。 首 先 ， 必 须 确定 数据 是 应 表 
示 为 一 条 边界 还 是 应 表示 为 整个 区 域 。 如 果 关 注 的 是 外 部 形状 特征 ， 壁 如 角 点 和 拐点 ， 则 表示 为 边界 
是 合适 的 。 如 果 我 们 关注 的 是 内 部 特性 ， 例 如 纹理 或 骨架 形状 ， 则 区 域 表示 是 合适 的 。 在 某 些 应 用 中 ， 
这 些 表示 彼此 是 互补 的 。 选 择 一 种 表示 仅 是 把 原始 数据 转换 为 适合 计算 机 进行 后 续 处 理 的 形式 的 一 部 分 。 
为 了 描述 数据 以 使 感 兴 趣 的 特征 更 明显 ， 必 须 确定 一 种 方法 。 描 述 又 称 为 特征 选 树 ， 它 涉及 提取 特征 ， 
可 得 到 某 些 感 兴趣 的 定量 信息 ,或 是 区 分 一 组 目标 与 其 他 目标 的 基础 。 

识别 是 基于 目标 的 描述 给 该 目标 赋予 标 志 ( 辟 如“ 车辆”) 的 过 程 。 如 1.1 节 详细 介绍 的 那样 ,我 们 
通过 阐述 识别 个 别 目标 的 方法 来 结束 数字 图 像 处 理 的 讨论 。 

到 目前 为 止 , 我 们 还 没有 谈 到 关于 先 验 知识 及 图 1.23 中 知识 库 与 各 个 处 理 模块 之 间 的 关系 。 有 关 问 
题 域 的 知识 已 经 以 知识 库 的 形式 编码 并 存 人 图 像 处 理 系统 中 。 这 一 知识 可 能 像 一 幅 图 像 详细 描述 区 域 
那样 简单 ， 在 这 里 定位 已 知 的 感 兴趣 的 信息 ， 可 将 限制 性 的 搜索 引导 到 要 寻找 的 信息 处 。 知 识 库 也 可 
能 相当 复杂 ， 如 材料 检测 问题 中 所 有 主要 缺陷 的 相关 列表 ， 或 者 包含 变化 检测 应 用 中 一 个 区 域 的 高 分 
辩 率 卫星 图 像 的 图 像 数据 库 。 除 了 引导 每 个 处 理 模块 的 操作 外 ， 知 识 库 还 要 控制 模块 之 间 的 交互 。 这 
一 特性 由 图 1.23 中 处 理 模 块 和 知识 库 之 间 的 双 头 箭头 表示 ， 而 单 头 箭头 则 用 于 连接 处 理 模块 。 

虽然 没有 专门 讨论 图 像 显 示 ， 但 要 记 住 图 像 显 示 是 很 重要 的 ， 观 察 图 像 处 理 的 结果 可 在 图 1.23 
中 的 任何 阶段 的 输出 处 执行 。 还 应 注意 ， 并 非 所 有 图 像 处 理应 用 都 需要 图 1.23 给 出 的 复杂 交互 。 事 
实 上 ， 在 某 些 情况 下 甚至 并 不 需要 所 有 这 些 模块 。 例 如 ， 用 于 人 眼 视觉 解释 的 图 像 增 强 就 很 少 要 求 
使 用 图 1.23 中 的 任何 其 他 步 又 。 然 而 ， 通 常 随 着 图 像 处 理 任务 复杂 性 的 增加 ， 需 要 做 更 多 的 处 理 才 
能 解决 问题 。 


1.5 图 像 处 理 系统 的 组 成 


20 世纪 80 年 代 中 叶 ， 世 界 各 地 售 出 的 各 种 型 号 的 图 像 处 理 系 统 ， 基 本 上 都 是 由 许多 主机 及 与 这 
” 些 主机 配套 的 外 设 组 成 的 。20 世纪 80 年 代 未 90 年 代 初 , 市 场 已 转 为 将 图 像 处 理 硬件 设计 为 与 工业 标 
准 总 线 兼 容 ， 并 能 配合 工程 工作 站 机 箱 和 个 人 计算 机 的 单 板 形式 。 除 了 降低 成 本 外 ， 这 一 市 场 转型 还 
如 催化 剂 一 样 催生 了 大 量 的 新 公司 ， 这 些 公 司 的 任务 是 开发 用 于 图 像 处 理 的 软件 。 
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虽然 针对 如 处 理 卫 星 图 像 的 大 规模 图 像 应 用 的 大 型 图 像 处 理 系统 一 直 在 出 售 ， 但 趋势 是 朝 着 小 型 
化 和 通用 化 的 小 型 机 并 带 有 专用 图 像 处 理 硬 件 的 混合 型 系统 方向 发 展 。 图 1.24 显示 了 用 于 数字 图 像 处 
理 的 一 个 典型 通用 系统 的 组 成 。 下 面 几 段 讨论 每 个 组 件 的 功能 ， 从 图 像 感知 开始 。 
关于 感知 , 需要 两 个 部 件 来 获取 数字 图 像 。 第 一 个 as 

部 件 是 物理 设备 ， 该 设备 对 我 们 希望 成 像 的 目标 辐射 i ameh i 

的 能 量 很 敏感 。 第 二 个 部 件 称 为 数字 化 器 ， 数 字 化 器 
是 一 种 把 物理 感知 装置 的 输出 转换 为 数字 形式 的 设备 。 
例如 , 在 数字 视频 摄像 机 中 , 传感器 产生 一 个 与 光 强 成 
正比 的 输出 , 数字 化 器 把 该 输出 转换 为 数字 数据 。 这 些 mAN 
主题 包含 在 第 2 章 中 。 

专用 图 像 处 理 硬件 通常 由 刚刚 谈 到 的 数字 化 器 与 
执行 其 他 原始 操作 的 硬件 [ 如 算术 逻辑 单元 (ALU) ] 

组 成 ， 算 术 逻 辑 单元 对 整个 图 像 并 行 执行 算术 与 逻辑 

运算 。 使 用 ALU 的 一 个 例子 是 与 数字 化 一 样 快 的 图 像 vis 

平均 操作 ， 这 一 操作 的 目的 是 降低 噪声 。 这 种 类 型 的 图 1.24 通用 图 像 处 理 系统 的 组 成 
硬件 有 时 称 为 前 端子 系统 ,其 显著 特点 是 速度 快 。 换 句 话说 , 该 单元 执行 要 求 快速 数据 吞吐 的 功能 (BF 
如 以 30 帧 / 秒 的 速率 来 数字 化 和 平均 视频 图 像 ) ， 典 型 的 主机 不 能 胜任 该 工作 。 

图 像 处 理 系统 中 的 计算 机 是 通用 计算 机 ， 其 范围 从 PC 到 超级 计算 机 。 有 时 在 专门 应 用 中 也 采用 
特殊 设计 的 计算 机 ， 以 达到 所 要 求 的 性 能 。 但 是 ， 这 里 感 兴趣 的 还 是 通用 图 像 处 理 系统 。 在 这 些 系统 
中 ,几乎 任何 配置 较 好 的 PC 对 于 离线 图 像 处 理 任务 都 是 适合 的 。 

图 像 处 理 软件 由 执行 特定 任务 的 专用 模块 组 成 。 一 个 设计 优良 的 软件 包 还 包括 为 用 户 写 代码 的 能 
J, 例如， 最 小 化 就 可 以 使 用 专用 模块 。 更 完善 的 软件 包 集成 了 这 些 模 块 ， 并 至 少 能 用 一 种 计算 机 语 
言 编写 通用 软件 命令 集 。 

大 容量 存储 能 力 在 图 像 处 理应 用 中 是 必需 的 。 尺 寸 为 1024 x 1024 像素 的 一 幅 图 像 ， 每 像素 的 灰 度 是 
8 比特 ， 如 果 图 像 不 压缩 ， 则 需要 MB 的 存储 空间 。 在 处 理 几 千 幅 甚至 几 百 万 幅 图 像 时 ， 在 图 像 处 理 系 
统 中 提供 足够 的 存储 空间 将 是 一 个 极 大 的 挑战 。 图 像 处 理应 用 的 数字 存储 分 为 三 个 主要 类 别 ，(1) 处 理 期 
间 的 短期 存储 ; (2) 关系 到 快速 调用 的 在 线 存储 ; (3) 档案 存储 ， 其 特点 是 不 频繁 访问 。 存 储 是 以 字 节 
(8 比特 ) 、 千 字 节 (1000 字 节 ) 、 兆 字 节 (100 万 字 节 ) 、 吉 字 节 (10 亿 字 节 ) 或 太 字 节 (TB) 来 计量 的 。 

提供 短期 存储 的 一 种 方法 是 使 用 计算 机 内 存 。 另 一 种 方法 是 采用 专用 的 存储 板 ， 这 种 存储 板 称 为 帧 
缓存 , 它们 可 以 存储 一 帧 或 多 帧 图 像 并 可 快速 访问 ,访问 速率 通常 为 视频 速率 (30 帧 / 秒 ) 。 后 一 种 方法 
实质 上 允许 瞬时 缩放 、 滚 动 (垂直 移动 ) 和 揪 动 (水 平移 动 ) 图 像 。 帧 缓冲 器 通常 放 在 专用 图 像 处 理 硬件 单 
元 中 ， 如 图 1.24 所 示 。 在 线 存储 通常 采用 磁盘 或 光 介 质 存储 。 在 线 存储 的 关键 特性 参数 是 对 存储 数据 
的 访问 频率 。 最 后 ， 档 案 存 储 是 以 大 容量 存储 要 求 为 特征 的 ， 但 无 须 频繁 访问 。 放 在 类 似 于 投 币 电 唱 
机 机 会 内 的 磁带 和 光盘 是 常用 的 档案 存储 介质 。 

今天 使 用 的 图 像 显示 器 主要 是 彩色 电视 监视 器 (更 好 一 些 的 是 平面 屏幕 ) 。 监 视 器 由 图 像 和 图 形 显 
示 卡 的 输出 驱动 ， 它 们 是 计算 机 系统 的 一 个 集成 部 分 。 对 于 图 像 显 示 应 用 不 可 能 没有 这 样 的 要 求 ， 即 
作为 计算 机 系统 的 一 部 分 ， 其 显示 卡 应 满足 商用 性 要 求 ， 在 有 些 情 况 下 还 要 求 立体 显示 。 立 体 显示 是 
通过 戴 在 用 户头 上 的 目镜 上 嵌入 两 个 小 显示 屏 的 头 亦 来 实现 的 。 

用 于 记录 图 像 的 硬 拷贝 设备 包括 激光 打印 机 、 胶 片 相机 、 热 敏 装置 、 喷 墨 装置 和 数字 单元 ， 如 











图 像 显 示 器 计算 机 大 容量 存储 








S| CD-ROM 等 。 胶 片 的 分 辩 率 最 高 ， 但 纸 作为 书写 材料 是 首选 介质 。 为 了 表现 图 像 ， 图 像 可 显示 在 透明 





22 胶片 上 ， 或 使 用 图 像 投 影 设 备 显示 在 数字 介质 中 。 后 者 作为 图 像 表现 的 标准 正在 被 人 们 逐步 接受 。 


第 1 章 A 论 17 


网 络 在 今天 所 用 的 计算 机 系统 中 几乎 都 是 默认 的 功能 。 因 为 在 图 像 处 理应 用 中 会 形成 大 量 数据 ， 
图 像 传 输 中 主要 考虑 的 问题 是 带宽 。 在 专用 网 络 中 ， 这 不 是 什么 大 问题 ， 但 通过 互联 网 进行 远程 通信 
并 不 总 是 有 效 的 。 所 幸 的 是 ， 随 着 光纤 与 其 他 宽带 技术 的 发 展 ， 这 一 状况 正在 迅速 得 到 改善 。 


小 结 


本 章 的 主要 目的 是 简要 介绍 数字 图 像 处 理 的 起 源 、 重 要 意义 、 当 前 和 未 来 的 应 用 领域 。 由 于 篇 幅 
所 限 ， 本 章 中 涉及 主题 的 覆 善 面 必然 不 太 全 面 ， 但 在 数字 图 像 处理 的 知识 宽度 和 应 用 范围 方面 应 能 给 
读者 留 下 深刻 的 印象 。 后 续 章节 将 介绍 图 像 处 理 理论 与 应 用 ， 并 给 出 大 量 实例 。 学 完 本 书 的 最 后 一 章 
后 ,读者 应 能 了 解数 字 图 像 处 理 领 域 的 当前 研究 进展 情况 。 
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引言 


本 章 的 主要 目的 是 介绍 本 书 所 用 到 的 数字 图 像 处 理 的 一 些 基本 概念 。2.1 节 简 述 人 类 视觉 系统 的 机 
H, 包括 眼中 图 像 的 形成 及 对 亮度 的 适应 和 鉴别 能 力 。2.2 节 讨论 光 、 电 磁 波 谱 的 其 他 成 分 及 它们 的 成 
像 特点 。2.3 节 讨 论 成 像 传感器 及 怎样 使 用 它们 产生 数字 图 像 。2.4 节 介 绍 均匀 图 像 取 样 及 灰 度 量化 的 

念 。 该 节 中 讨论 的 其 他 主题 包括 数字 图 像 表 示 、 图 像 中 取样 数 和 灰 度 级 变化 的 影响 、 空 间 和 灰 度 分 
状 率 的 概念 ， 以 及 图 像 内 插 的 原理 。2.5 节 介 绍 像素 间 的 各 种 基本 关系 。 最 后 ，2.6 节 介 绍 本 书 用 到 的 
主要 数学 工具 。 该 节 的 第 二 个 目的 是 帮助 读者 积累 一 些 在 各 种 基本 图 像 处 理 任务 中 如 何 运 用 这 些 工 具 
的 经 验 。 需 要 时 ,这些 工具 及 其 应 用 范围 将 在 本 书 的 剩余 部 分 展开 。 


2.1 视觉 感知 要 素 


虽然 数字 图 像 处 理 这 一 领域 建立 在 数学 和 概率 公式 表示 的 基础 之 上 , 但 人 的 直觉 和 分 析 在 选择 一 
种 技术 而 不 选择 男 一 种 技术 时 会 起 核心 作用 ， 这 种 选择 通常 是 基于 主观 的 视觉 判断 做 出 的 。 因 此 ， 将 
大 概 了 解 人 类 的 视觉 感知 作为 学 习 本 书 的 起 点 是 合适 的 。 鉴 于 这 一 主题 的 复杂 性 和 宽泛 性 ， 这 里 仅 涉 
及 人 类 视觉 的 最 基本 方面 。 特 别 地 ， 我 们 的 兴趣 在 于 人 类 形成 并 感知 图 像 的 机 理 和 人 参数。 我 们 的 兴趣 
还 在 于 通过 数字 图 像 处 理 的 一 些 要 素来 了 解 人 类 视觉 的 物理 限制 。 因 此 ， 人 类 与 电子 成 像 设备 相 比 ， 
在 分 辨 率 和 对 光照 变化 的 适应 能 力 方面 不 仅 有 趣 ， 从 实践 的 角度 来 看 也 很 重要 。 


2.1.1 人 了 眼 的 结构 


图 2.1 显示 了 人 了 眼 的 一 个 简化 剖面 图 。 眼 睛 的 形状 近似 为 一 个 球体 ， 其 平均 直径 约 为 20 mm. IR 
HF SRE: 角膜 与 巩膜 外 壳 、 脉 络 膜 和 视网膜 。 角 膜 是 一 种 硬 而 透明 的 组 织 ， 覆 盖 着 眼睛 的 前 
表面 。 与 角膜 相连 的 巩膜 是 一 层 包围 眼球 其 余部 分 的 不 透明 膜 。 

脉络 膜 位 于 巩膜 的 正 下 方 。 脉 络 膜 包含 有 血管 网 ， 它 是 眼睛 的 重要 滋养 源 。 即 使 是 对 脉络 膜 表 
面 并 不 严重 的 损害 也 有 可 能 严重 地 损害 眼睛 ， 引 起 限制 血液 流动 的 炎症 。 脉 络 膜 外 过 着色 很 重 ， 
因此 有 助 于 减少 进入 眼 内 的 外 来 光 和 了 眼球 内 反 向 散射 光 的 数量 。 脉络 膜 的 最 前 面 分 为 睫 状 体 和 虹膜 。 
虹膜 的 收缩 和 扩张 控制 着 进入 眼睛 的 光量 。 虹 膜 中 间 开 口 (瞳孔 ) 的 直径 可 变 ， 变 化 范围 为 2~8 mm. 
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虹膜 的 前 面包 含有 了 眼睛 的 可 见 色素 , 而 后 面 则 包含 有 
黑色 色素 。 

晶状体 由 同心 纤维 细胞 层 组 成 ， 并 由 附 在 睫 状 
体 上 的 纤维 悬挂 。 唱 状 体 包含 60% ~70% 的 水 、6% 
的 脂肪 和 比 眼 中 任何 其 他 组 织 都 多 的 蛋白 质 。 晶 状 
体 由 稍 黄 的 色素 着 色 ， 其 颜色 随 着 人 的 年 龄 的 增 大 
而 加 深 。 在 极端 情况 下 ， 晶 状 体会 过 于 混浊 ， 这 通 
常 是 由 白内障 等 疾病 引起 的 ， 可 能 导致 低下 的 彩色 
辨别 能 力 和 视觉 清晰 度 的 损失 。 晶 状 体 吸 收 大 约 8% 
的 可 见 光谱 ， 对 短波 长 的 光 有 较 高 的 吸收 率 。 在 晶 
状 体 结构 中 ， 蛋 白质 吸收 红外 光 和 紫外 光 ， 吸 收 过 
量 时 会 伤害 眼睛 。 

眼睛 最 里 面 的 膜 是 视网膜 ， 它 布 满 了 整个 后 部 
的 内 壁 。 眼 睛 适当 地 聚焦 时 ,来自 眼睛 外 部 物体 的 
光 在 视网膜 上 成 像 。 感 受 器 通过 感受 视网膜 表面 分 
布 的 不 连续 光 来 形成 图 案 。 光 感受 器 分 类 两 类 : 锥 
状 体 和 杆 状 体 。 每 只 眼睛 中 的 锥 状 体 数量 约 为 图 2.1 人 了 眼 剖 面 简 图 
600~700 万 个 :它们 主要 位 于 视网膜 中 称 为 中 央 凹 的 中 间 部 分 ， 对 颜色 高 度 敏 感 。 使 用 这 些 锥 状 体 ， 
人 们 可 以 充分 地 分 辨 图 像 细节 ， 因 为 每 个 锥 状 体 都 连接 到 了 自身 的 神经 未 梢 。 肌 肉 控制 眼球 的 转动 ， 
直到 感 兴趣 物体 图 像 落 到 中 央 止 上 。 锥 状 体 视觉 称 为 白 尽 视 党 或 亮 视觉 。 

杆 状 体 的 数量 更 多 : 约 有 7500 ~15 000 万 个 杆 状 体 分 布 在 视网膜 表面 。 由 于 分 布 面积 较 大 而 且 几 
个 杆 状 体 连 接 到 一 个 神经 未 梢 ， 因 此 减少 了 这 些 感受 器 感知 细节 的 数量 。 杆 状 体 用 来 给 出 视野 内 的 总 
体 图 像 。 它 们 没有 彩色 感觉 ， 对 低 照 明度 敏感 。 例 如 ， 白 天 色彩 鲜艳 的 物体 ， 在 月 光 下 却 没有 颜色 ， 
因为 此 时 只 有 杆 状 体 受到 刺激 。 这 种 现象 称 为 暗 视觉 或 微 光 视觉 。 

图 2.2 显 示 了 右 眼中 通过 眼睛 光 神经 出 现 区 的 剖面 的 杆 状 体 和 锥 状 体 密度 。 在 这 一 区 域 , 由 于 没有 
感受 器 而 导致 了 所 谓 的 盲点 ( 见 图 2.1) 。 除 了 这 一 区 域 , 感受 器 的 分 布 关 于 中 央 四 径 向 对 称 。 感受器 密 
度 根据 距 中 央 思 的 度数 来 度量 ( 即 离开 视 轴 的 度数 , 它 由 视 轴 和 通过 晶状体 中 心 并 相交 于 视网膜 的 一 条 
直线 的 夹 角度 量 ) 。 注意 , 图 2.2 中 的 锥 状 体 在 视网膜 的 中 心 最 密 (在 中 央 凹 的 中 心 区域 ) 。 还 应 注意 到 ， 
从 该 中 心 向 外 到 偏离 视 轴 大 约 20° 处 , 杆 状 体 的 密度 逐渐 增 大 ,然后 向 外 到 视网膜 的 极限 边缘 处 ,密度 
逐渐 下 降 。 
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图 2.2 ”视网膜 中 杆 状 体 和 锥 状 体 的 分 布 





22 数字 图 像 处 理 (第 三 版 ) 


中 央 止 本 身 是 视网膜 中 直径 约 为 1.5 mm 的 圆 形 止 坑 。 然 而 ， 为 便于 后 续 的 讨论 , 我 们 把 它 近似 
为 方形 或 矩形 敏感 元 素 阵 列 会 更 有 用 。 因 此 ， 为 解释 方便 ， 可 把 中 央 四 视 为 大 小 为 1.5 mmx 1.5 mm 
的 方形 传感器 阵列 。 在 视网膜 的 这 一 区 域 中 ， 锥 状 体 的 密度 约 为 150 000 个 / mm?。 基 于 这 一 近似 ， 
眼睛 中 最 高 敏感 区 域 的 锥 状 体 个 数 约 为 337 000。 从 自然 分 辩 能 力 的 角度 看 , 恰好 与 一 个 中 等 分 辨 率 的 
电荷 耦合 元 件 (CCD) 成 像 芯片 具有 的 元 素数 量 相当 ， 接 收 器 阵列 不 大 于 5 mmx 5mm. 尽管 人 类 的 智 
慧 和 视觉 经 验 使 得 这 种 比较 很 肤浅 ， 但 请 记 住 ， 人 眼 分 辨 细节 的 能 力 与 当前 电子 成 像 传感器 是 可 以 类 
比 的 。 


2.1.2 ”眼睛 中 图 像 的 形成 


在 普通 照相 机 中 ， 镜 头 有 固定 的 焦距 ， 各 种 距离 的 聚焦 是 通过 改变 镜头 和 成 像 平 面 间 的 距离 实 
现 的 ， 胶 片 放 在 成 像 平 面 上 (数码 相机 情况 下 是 成 像 芯片 ) 。 在 人 眼中 ， 情 形 则 与 此 相反 ;晶状体 和 
成 像 区 域 (视网膜 ) 之 间 的 距离 是 固定 的 ， 正 确 聚 焦 的 焦距 是 通过 改变 晶状体 的 形状 来 得 到 的 。 睫 状 
体 中 的 纤维 可 实现 这 一 功能 ， 在 远离 或 接近 目标 物 时 ， 纤 维 会 分 别 压 扁 或 加 厚 晶 状 体 。 晶 状 体 中 心 
和 视网膜 沿 视 轴 的 距离 约 为 17 mm， 焦距 约 为 14~17 mm。 在 眼睛 放松 且 聚 焦距 离 大 于 3 mif, WE 
约 为 17 mm. 

图 2.3 中 的 几何 关系 说 明了 如 何 得 到 一 幅 在 视网膜 上 形成 的 图 像 的 尺度 。 例 如 , 假设 一 个 人 正在 观 
看 距 其 100 m 处 的 高 为 15 m 的 一 棵 树 。 令 有 表示 视网膜 图 像 中 该 物体 的 高 度 ， 由 图 2.3 的 几何 形状 可 
以 看 出 15/100 = N17 或 h=2.55 mm, TERN 2.1.1 节 指 出 的 那样 ， 视 网 膜 图 像 主要 聚焦 在 中 央 四 区 域 。 
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2.1.3 ”亮度 适应 和 辨别 am 


因为 数字 图 像 作 为 离散 的 灰 度 集 来 显示 ,所 以 眼 
青 对 不 同 亮度 级 别 之 间 的 辨别 能 力 在 显示 图 像 处 理 
结果 时 是 一 个 重要 的 考虑 因素 。 人 的 视觉 系统 能 够 适 
应 的 光 强 度 级 别 范围 很 宽 一 从 暗 阔 值 到 强 闪 光 约 
有 108 个 量 级 。 实 验 数据 指出 ， 主 观 亮度 ( 即 由 人 的 
视觉 系统 感知 的 亮度 ) 是 进入 人 了 眼 的 光 强 的 对 数 函 
数 。 图 2.4 中 画 出 的 光 强 度 与 主观 亮度 的 关系 曲线 说 
明了 这 一 特性 ,长 实 线 代表 视觉 系统 能 适应 的 光 强 范 
围 。 在 亮 视觉 中 ， 该 范围 约 为 10;。 由 暗 视 觉 逐 浙 过 aa 
渡 到 亮 视觉 的 近似 范围 为 0.001~0.1mL (BAA) (在 对 SEE 4 

C| 数 坐 标 中 为 -3~-1mL) , 图 中 画 出 了 该 范围 内 这 一 适 光 强 的 对 数 (mL) 

62) 应 曲线 的 两 个 分 支 。 图 2.4 显示 了 特殊 适应 级 别 的 主观 亮度 感知 范围 
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解释 图 2.4 中 描述 的 令 人 印象 深刻 的 动态 范围 的 基本 要 点 是 ， 视 觉 系统 不 能 同时 在 一 个 范围 内 工 
作 。 确 切 地 说 ， 它 是 通过 改变 其 整个 灵敏 度 来 完成 这 一 较 大 变动 的 ， 这 就 是 周知 的 亮度 适应 现象 。 眼 
睛 可 以 同时 辨别 的 不 同 强度 级 别 的 总 范围 与 整个 适应 范围 相 比 很 小 。 对 于 任何 给 定 的 条 件 集合 , 视觉 
系统 的 当前 灵敏 度 级 别称 为 亮度 适应 级 别 ， 例 如 ， 它 可 能 对 应 于 图 2.4 中 的 亮度 Bs。。 较 短 的 交叉 线 表 
示 当 眼睛 适应 这 一 强度 级 别 时 ， 人 了 眼 所 能 感知 的 主观 亮度 范围 。 注 意 ， 这 一 范围 是 有 一 定 限制 的 ， 级 
别 Bs 或 低 于 级 别 Bs 的 刺激 都 感知 为 不 可 辨别 的 黑色 。 该 曲线 的 上 部 实际 上 不 受 限 制 ， 但 如 果 延 伸 太 
远 也 会 失去 意义 ， 因 为 高 得 多 的 强度 将 会 把 适应 能 力 提 高 到 比 B 更 高 的 水 平 。 

在 任何 特定 的 适应 级 别 上 ， 人 了 眼 辨别 光 强 变化 的 能 力也 是 值得 考虑 的 因素 。 用 于 确定 人 类 视觉 系 
统 亮度 辨别 能 力 的 一 个 著名 实验 ， 由 一 个 注视 对 象 和 大 到 足以 使 其 占有 全 部 视野 的 均匀 发 光 区 组 成 。 
这 一 区 域 是 一 个 典型 的 漫 反 射 体 ， 辟 如 不 透明 玻璃 ,使 用 强度 7 可 变 的 一 个 光源 从 后 面 照 向 该 漫 反 射 
体 。 在 该 视野 中 增加 一 个 照射 分 量 A7， 形 成 一 个 持续 时 间 很 短 的 闪烁 , 该 闪烁 以 均匀 光 场 中 央 的 圆 形 
方式 出 现 ， 如 图 2.5 所 示 。 

WR Al 不够 亮 ， 则 目标 不 变 ， 表明 没 有 可 觉察 的 变化 。 当 AT 逐渐 加 强 时 ， 目 标 会 给 出 肯定 的 响 
应 “是 ”， 指 出 一 个 可 觉察 的 变化 。 最 后 ， 当 A7 足够 强 时 ， 目 标 将 始终 给 出 肯定 的 响应 “是 ”"。Al. /1 
称 为 韦伯 比 ， 其 中 AL, 是 在 背景 照明 为 了 时 可 辨别 照明 增 量 的 50%。 AL, /7 值 较 小 意味 着 可 辨别 强度 
较 小 的 百分比 变化 , 这 表示 亮度 辨别 能 力 “ 较 好 "。 相 反 ，A1. /7 较 大 意味 着 要 求 有 较 大 强度 的 百分比 
变化 ， 这 表示 亮度 辨别 能 力 “ 较 差 ”。 

作为 logI 的 函数 ，log AZ, /7 曲线 具有 图 2.6 所 示 的 一 般 形状 。 这 一 曲线 表明 ， 在 低 照明 级 别 ， 亮 
度 辨 别 较 差 (韦伯 比 大 ) ， 且 它 会 随 着 背景 照明 的 增加 而 明显 改善 (韦伯 比 降低 ) 。 曲 线 中 的 两 个 分 支 反 
映 了 这 样 一 个 事实 ， 即 在 低 照 明 水 平 情况 下 ,视觉 由 杆 状 体 执行 , 在 高 照明 水 平 情况 下 (表示 较 好 的 辨 
别 能 力 ) ， 视 觉 由 锥 状 体 执行 。 


log Ay /7 
l 
© 
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—2.0 
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log / 


图 2.5 用 于 表征 亮度 辨别 的 基本 实验 设置 图 2.6 作为 强度 函数 的 典型 韦伯 比 


如 果 背 景 照明 保持 恒定 ， 并且 代替 闪光 的 其 他 光源 的 强度 现在 允许 从 不 能 觉察 逐渐 变化 到 总 可 以 
被 觉察 ， 那么 典型 观察 者 可 以 辨别 总 共 12 级 到 24 级 的 不 同 强度 变化 。 粗 略 地 看 ， 该 结果 与 一 个 人 观 
看 单 色 图 像 中 的 任意 一 点 时 所 觉察 到 的 不 同 强度 的 数量 相关 。 这 个 结果 并 不 意味 着 一 幅 图 像 可 以 由 这 
样 少 的 强度 值 来 表示 ， 因 为 当 眼 睛 扫 视 图 像 时 ,平均 背景 在 变化 ， 从 而 允许 在 每 个 新 的 适应 级 别 上 检 
测 一 组 不 同 的 增 量 变化 。 最 终结 果 是 眼睛 能 够 辨别 更 宽 范围 的 整个 强度 。 事 实 上 ， 我们 将 在 2.4.3 节 说 
明 ， 眼 睛 能 够 检测 到 用 不 足 24 级 强度 表示 的 单 色 图 像 中 的 令 人 讨厌 的 轮廓 效应 。 

两 种 现象 清楚 地 表明 感知 亮度 不 是 强度 的 简单 函数 。 第 一 种 现象 基于 这 样 一 个 事实 ， 即 视觉 
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系统 往往 会 在 不 同 强度 区 域 的 边界 处 出 现 “下 神 ” 或 “上 
冲 ” 现 象 。 图 2.7 (a) 显示 了 这 种 现象 的 一 个 典型 例子 。 虽 然 ”下 
条 带 的 强度 恒定 ， 但 在 靠近 边界 处 我 们 实际 上 感知 到 了 带 。“ 
有 毛 边 的 亮度 模式 [ 见 图 2.7(c) |, 这 些 看 起 来 带 有 毛 边 的 
带 称 为 马赫 带 ， 厄 恩 斯 特 ' 马赫 于 1865 年 首次 描述 了 这 一 
现象 。 

第 二 种 现象 称 为 同时 对 比 ， 它 与 这 样 一 个 事实 有 关 ， 即 感 H 
知 区 域 的 亮度 并 不 简单 地 取决 于 其 强度 , 如 图 2.8 所 示 。 所 有 
的 中 心 方块 都 有 完全 相同 的 强度 。 然 而 ， 随 着 背景 变 得 更 完 ， 
它们 在 眼睛 里 会 变 得 更 暗 。 一 个 更 熟悉 的 例子 是 一 张 纸 ， 一 张 oh SS TCS Pe 
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晴 来 直 视 明亮 的 天 空 时 ， 它 看 起 来 会 总 是 时 黑色 。 - 
人 类 感知 现象 的 另 一 些 例子 就 是 错觉 ， 在 错觉 中 ,眼睛 
填充 了 不 存在 的 信息 或 错误 地 感知 了 物体 的 几何 特点 图 29 L 
给 出 了 一 些 例子 ,在 图 2.9(a) 中 , 正方 形 的 轮廓 看 起 来 很 清楚 ， Sey 





尽管 图 像 中 并 没有 定义 这 样 一 个 图 形 的 直线 。 在 图 2.9 (b) 中 可 
以 看 到 相同 的 效果 ， 只 是 这 次 是 一 个 圆 ; 注意 ， 仅 有 几 条 直 
线 就 足以 导致 一 个 完整 圆 的 错觉 。 图 2.9 (c) 中 的 两 条 水 平 线段 的 长 度 相 同 ,但 看 起 来 一 条 显得 比 男 一 条 
短 。 最 后 ， 图 2.9(d) 中 45° 方 向 的 所 有 直线 都 是 等 间距 的 平行 线 ， 然 而 画 有 交叉 影 线 时 就 产生 了 错觉 ， 
觉得 这 些 线 不 再 平行 。 错 觉 是 人 类 视觉 系统 的 一 种 特性 ,但 这 一 特性 尚未 被 人 类 完全 了 解 。 


e 3 


图 2.7 “马赫 带 效应 图 解 
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图 2.8 同时 对 比 的 几 个 例子 。 所 有 的 中 心 方块 都 有 相同 的 Bue 
强度 ， 但 随 着 背景 的 变 亮 ， 它 们 看 起 来 逐渐 变 暗 图 2.9 一 些 典 型 的 错觉 


2.2 ” 光 和 电磁 波谱 


电磁 波谱 在 1.3 节 中 已 做 过 介绍 ， 现 在 更 详细 地 研究 这 一 主题 。1666 年 ， 艾 萨 克 ' 牛顿 发 现 ， 当 
一 束 太阳 光 通 过 一 个 玻璃 棱镜 后 ， 显 示 的 光束 不 再 是 白光 ， 而 是 由 一 端 为 紫色 而 男 一 端 为 红色 的 连续 
色谱 组 成 。 如 图 2.10 所 示 ， 我 们 感受 到 的 可 见 光 的 彩色 范围 只 占 电 磁 波 的 一 小 部 分 。 在 波谱 的 一 端 是 
= 无 线 电波 , 其 波长 是 可 见 光波 长 的 几 十 亿 倍 。 波谱 的 另 一 端 是 伽 马 射线 , 其 波长 比 可 见 光 小 几 百 万 倍 。 
电磁 波谱 可 用 波长 、 频 率 或 能 量 来 描述 。 波 长 AO 和 频率 O) 的 关系 可 用 下 式 描述 : 
65 | 
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Az=clv (2.2-1) 
式 中 是 光速 (2.998x10' m/s) 。 电 磁 波 谱 的 各 个 分 量 的 能 量 由 下 式 给 出 ; 
E=hyv (2.2-2) 


式 中 由 是 普 朗 克 常 数 。 波 长 的 单位 是 米 (m) ， 最 常用 的 单位 是 微米 (表示 为 Jm，1 hm= 10“m) 和 纳米 
(表示 为 Im，1 nm = 107m). SAAR (Hz) KAA, 1 Hz 表示 正弦 波 每 秒 1 个 周期 。 常 用 的 能 
单位 是 电子 伏特 。 

一 个 光子 的 能 量 〈 电 子 伏特 





10° 0 1 0 
频率 (Hz) 

10? 10% 10%  10'8 10" 306 40% 10! 30% 102 10! 10! 40° . 10% 10 10° 105 
| | LE- 
波长 (m) 

10? 107 | to -10- 28 Go 10" ests aa LI 10-107? TO I i te? 1 





0.4 10S 0.5 x 10° 0.6 x 10~° 0.7 x 10°° 
紫外 线 紫色 蓝 色 绿色 黄色 橙色 红色 红外 线 


图 2.10 电磁 波谱 。 为 便于 解释 ， 可 见 光 谱 已 被 放大 ， 但 请 注意 ， 可 见 光谱 是 电磁 波谱 中 相当 罕 的 一 部 分 


电磁 波 可 视 为 以 波长 4 传播 的 正弦 波 ( 见 图 2.11) , | 

或 视 为 没有 质量 的 粒子 流 ， 每 个 粒子 以 波 的 模式 以 光 aes 

速 传播 和 移动 。 每 个 无 质量 的 粒子 包含 一 定 的 (一 束 ) 

能 量 ， 每 束 能 量 称 为 一 个 光子 。 从 式 (2.2-2) 可 以 看 出 

能 量 与 频率 成 正比 ， 因 此 更 高 频率 (更 短波 长 ) 的 电磁 

现象 的 每 个 光子 携带 有 更 多 的 能 量 。 这 样 ， 无 线 电波 图 211 RRA 

有 低能 量 光子 , 微波 比 无 线 电波 具有 较 多 的 能 量 , 红 

外 波 具有 的 能 量 还 要 多 ， 然 后 是 可 见 光 、 紫 外 线 、X 射线 和 仙 马 射线 ， 其 中 仙 马 射线 的 能 量 最 高 ， 这 
就 是 伽 马 射线 对 活体 组 织 危害 很 大 的 原因 。 

光 是 一 种 特殊 的 电磁 辐射 ， 它 可 以 被 人 眼 感知 。 为 便于 讨论 ， 扩 展 后 的 可 见 光 谱 (彩色 ) 段 如 图 2.10 
所 示 (第 6 章 将 更 详细 地 讨论 彩色 ) 。 电磁 波谱 可 见 光波 段 的 跨越 范围 为 0.43 pm( 紫 色 ) ~0.79 hm (红色 ) 。 

为 方便 起 见 ， 彩 色谱 分 为 6 个 主要 区 域 :紫色 、 蓝 色 、 绿 色 、 黄 色 、 橘 黄色 和 红色 。 每 种 颜色 (或 电磁 
波谱 的 其 他 分 量 ) 不 是 突然 终止 的 ， 而 是 混合 平滑 地 过 渡 到 另 一 种 颜色 的 ， 如 图 2.10 所 示 。 

人 感受 到 的 物体 颜色 由 物体 反射 的 光 的 性 质 决定 。 以 所 有 可 见 波长 相对 平衡 地 反射 光 的 物体 ， 对 
观察 者 而 言 是 白色 的 。 然而 ,一 个 物体 在 可 见 光谱 的 有 限 范围 内 反射 时 , 会 呈现 各 种 颜色 色调 。 例如， 
绿色 物体 反射 波长 范围 为 500~570 nm 的 光 ， 而 吸收 其 他 波长 的 大 部 分 能 量 。 

没有 颜色 的 光 称 为 单 色光 或 无 色光 。 单 色光 的 唯一 属性 是 其 强度 或 大 小 。 因 为 感知 单 色光 的 强度 
从 黑色 到 灰色 变化 ， 最 后 到 白色 ， 灰 度 级 一 词 通常 用 来 表示 单 色光 的 强度 。 在 后 续 讨 论 中 ,我 们 ler 
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将 交 蔡 地 使 用 强度 和 灰 度 级 这 两 个 术语 。 从 黑 到 白 的 单 色 光 的 度量 值 范围 通常 称 为 灰 度 级 ， 而 单 色 图 


像 常 称 为 灰 度 图 像 。 

正如 前 面 指出 的 那样 ， 彩 色光 的 电磁 能 谱 的 跨越 范围 为 0.43 hm (紫色 )~0.79 hm (红色 ) 。 除 了 频 ， 
率 之 外 ,我 们 还 用 三 个 基本 量 来 描述 彩色 光源 的 质量 : 发 光 强 度 、 光 通 量 和 亮度 。 发 光 强 度 是 从 光源 
流出 的 能 量 总 量 ， 通 常用 瓦特 (W) 来 度量 。 用 流明 数 (lm) 度 量 的 光 通 量 给 出 了 观察 者 从 光源 感受 到 的 
能 量 。 例 如 ， 从 远 红 外 光谱 范围 的 光源 发 射出 的 光 具 有 实际 意义 的 能 量 ， 但 观察 者 却 很 难 感知 到 它 。 
它 的 光 通 量 几 乎 是 零 。 最 后 , 如 2.1 节 所 讨论 的 那样 , 亮度 是 光 感知 的 主观 描绘 子 , 它 实际 上 不 能 度量 。 
它 具 体 体 现 了 强度 的 无 色 概念 ， 是 描述 彩色 感觉 的 参数 之 一 。 

继续 图 2.10 的 讨论 ， 我 们 注意 到 电磁 波谱 的 短波 长 一 端 是 伽 马 射线 和 X 射线 。 正 如 1.3.1 节 讨 论 
的 那样 ， 伽 马 辐射 对 医学 和 天 文学 成 像 很 重要 ， 对 核 环境 中 的 辐射 成 像 也 很 重要 。 硬 (高 能 ) X 射线 用 
于 工业 应 用 中 。 胸 透 和 牙科 使 用 的 X 射线 位 于 X 射线 频段 的 低能 ( 软 ) 端 。 软 X 射线 波段 过 渡 到 远 紫 
外 线 的 区 域 ， 而 远 紫 外 区 域 又 与 较 长 波长 的 可 见 光谱 混合 。 逐 步 移 向 更 高 的 波长 ， 我 们 会 下 到 红外 波 
段 ， 红 外 波段 会 辐射 热 ， 这 使 得 它 在 依靠 “ 热 特性 ”成 像 的 应 用 中 非常 有 用 。 红 外 波段 靠近 可 见 光 谱 
的 部 分 称 为 近 红外 区 域 ， 而 该 波段 的 另 一 端 称 为 远 红外 区 域 。 远 红外 区 域 的 后 部 与 微波 频段 混合 。 这 
个 波段 是 众所周知 的 微波 炉 的 能 源 ， 但 它 还 有 许多 其 他 用 途 ， 包 括 通信 与 雷达 。 最 后 ， 无 线 电波 段 包 
括 电 视 、 调 幅 收音 机 和 调频 收音 机 。 在 更 高 的 能 级 ， 从 某 些 天 体 发 出 的 无 线 电信 和 号 在 天 文 观测 中 很 有 
用 。1.3 节 给 出 了 刚才 讨论 的 多 数 波段 成 像 的 例子 。 

原理 上 ， 如 果 可 以 开发 出 一 种 传感器 来 检测 由 一 种 电磁 波谱 发 射 的 能 量 ， 那 么 我 们 就 可 以 在 该 波 
段 上 对 感 兴趣 的 事件 成 像 。 但 要 注意 的 一 点 是 ， 要 求 “看 到 ”一 个 物体 的 电磁 波 的 波长 必须 小 于 等 于 
物体 的 尺寸 。 例 如 ,水 分 子 直径 的 量 级 是 10”m, 若 要 研究 该 分 子 , 则 需要 一 个 能 在 远 紫 外 或 软 X 射 
线 范 围 发 射 的 光源 。 这 个 限制 与 传 感 材料 的 物理 特性 一 起 确立 了 成 像 传 感 器 功能 的 基本 限制 ， 辟 如 今 
天 所 用 的 可 见 光 、 红 外 线 和 其 他 传感器 。 

虽然 成 像 主要 以 电磁 波 发 射 的 能 量 为 基础 ， 但 这 并 不 是 生成 图 像 的 唯一 方法 。 例 如 ，1.3.7 节 讨论 
的 物体 反射 的 声波 也 可 用 于 形成 超声 波 图 像 。 其 他 的 主要 数字 图 像 源 是 电子 显微镜 的 电子 束 和 用 于 图 
形 与 可 视 化 的 合成 图 像 。 


2.3 图 像 感知 和 获取 


我 们 感 兴趣 的 多 数 图 像 都 是 由 “照射 ” 源 和 形成 图 像 的 “场景 ”元 素 对 光 能 的 反射 或 吸收 而 产 
生 的 。 把 “照射 ”和 “场景 ”加 上 引号 是 为 了 强调 这 样 一 个 事实 ， 即 比 我 们 所 熟悉 的 一 个 可 见 光源 
每 天 照射 普通 的 三 维 场景 情况 更 一 般 。 例 如 ， 照 射 可 能 由 电磁 能 源 引 起 ， 如 雷达 、 红 外 线 或 X 射线 
系统 。 但 是 ， 正 如 前 面 指出 的 那样 ， 照 射 也 可 以 由 非 传统 光源 (如 超声 波 ) 甚至 由 计算 机 产生 的 照 
射 模式 产生 。 类 似 地 ， 场 景 元 素 可 能 是 熟悉 的 物体 ， 但 它们 也 可 能 是 分 子 、 沉 积 岩 或 人 类 的 大 脑 。 
依赖 光源 的 特性 ， 照 射 被 物体 反射 或 透射 。 第 一 类 例子 是 从 平坦 表面 反射 。 第 二 类 例子 是 为 了 产 
生 一 幅 X 射线 照片 ,让 XX 射线 透 过 病人 的 身体 。 在 某 些 应 用 中 ,反射 能 或 透射 能 可 聚焦 到 一 个 光 
转换 器 上 (如 荧光 屏 ) ， 光 转换 器 再 把 能 量 转 换 为 可 见 光 。 电 子 显微镜 和 某 些 伽 马 成 像 应 用 就 使 用 
这 种 方法 。 

图 2.12 显示 了 用 于 将 照射 能 量变 换 为 数字 图 像 的 三 种 主要 传感器 配置 。 原 理 很 简单 : 通过 组 合 输 
入 电能 和 对 特 珠 类 型 检测 能 源 敏 感 的 传感器 材料 ， 把 输入 能 源 转 变 为 电压 。 输 出 电压 波形 是 传感器 的 
响应 ， 通 过 把 传感器 响应 数字 化 ， 从 每 个 传感器 得 到 一 个 数字 量 。 在 这 一 节 中， 我 们 将 关注 图 像 感知 
和 生成 的 主要 方式 。 图 像 数 字 化 将 在 2.4 节 讨 论 。 
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2.12 (a) 单 个 成 像 传感器 ; (b) 条 带 传感器 ; 〈c) 阵列 传感器 


2.3.1 使 用 单个 传感器 获取 图 像 


图 2.12 (a) 显示 了 单个 传感器 的 部 件 。 也 许 最 熟悉 的 这 类 传感器 是 光 二 极 管 ， 它 由 硅 材 料 构成 ,并 
且 其 输出 电压 波形 与 人 射 光 成 正比 。 在 传感器 前 面 用 一 个 滤 光 器 改善 选择 性 。 例 如 ， 光 传感器 前 面 的 


”绿色 (通过 ) 滤 光 器 有 利于 彩色 谱 的 绿 波段 光 通过 。 因 此 ， 传 感 器 输出 的 绿 光 比 可 见 光 谱 中 的 其 他 成 分 


” 鼓 上 ， 鼓 的 机 械 转 动 提供 了 一 个 维度 的 位 移 。 单 个 传 感 


要 强 。 

为 使 用 单一 传感器 产生 二 维 图 像 , 在 传感器 和 成 像 
区 域 之 间 必 须 有 x 方 向 和 ?方向 的 相对 位 移 。 图 2.13 示 
出 了 一 个 用 于 高 精度 扫描 的 配置 ,其 中 底片 安装 在 一 个 





器 安装 引导 螺杆 上 ， 它 提供 垂直 于 转动 方向 上 的 移动 。 
rr 
率 图 像 的 一 (但 ，。 另 -种 类 似 站 
的 机 械 配 置 使 用 一 个 平面 床 ， 传 感 器 则 在 两 个 方向 线性 。 图 213 党 个 传 感 尖 通过 运动 来 生成 一 维 图 像 

移动 。 这 些 类 型 的 机 械 数字 化 仪 有 时 称 为 微 密度 计 。 

使 用 单个 传感器 成 像 的 另 一 个 例子 是 将 一 个 激光 源 和 传感器 放 在 一 起 。 使 用 镜子 来 控制 扫描 模式 
的 发 射 光束 ， 并 将 反射 的 激光 信号 引导 到 传感器 。 这 种 配置 也 可 使 用 条 形 或 矩形 传感器 获取 图 像 ， 这 
种 配置 将 在 后 续 两 节 中 加 以 讨论 。 


2.3.2 ”使 用 条 带 传感器 获取 图 像 


与 单个 传感器 相 比 ,更 常用 的 几何 结构 是 由 内 骸 式 传感器 组 成 的 传感器 带 ， 如 图 2.12 (b) 所 示 。 这 
种 传 感 需 带 在 一 个 方向 上 提供 成 像 单元 。 垂 直 于 传感器 带 的 运动 在 另 一 方向 上 成 像 , 如 图 2.14 (a) 所 示 。 
这 是 大 多 数 平板 扫描 仪 中 使 用 的 排列 方式 。 感知 设 备 可 能 内 嵌 有 4000 个 或 更 多 的 传感器 。 内 骸 传 感 器 
常用 于 航空 成 像 应 用 中 ， 在 这 种 应 用 中 ,成 像 系 统 安装 在 一 架 飞行 器 上 ， 飞 行 器 以 恒定 高 度 和 速度 飞 
过 被 成 像 的 地 区 。 能 响应 各 种 电磁 波谱 波段 的 一 维 传感器 带 垂直 于 飞行 方向 安装 。 成 像 传感器 带 一 次 
给 出 一 幅 图 像 的 一 行 ， 传 感 器 带 的 运动 则 完成 另 一 维度 的 二 维 图 像 。 透 镜 和 其 他 聚焦 方法 用 于 把 扫描 
区 域 投影 到 传感器 上 。 

以 圆 环 形 方式 安装 的 传感器 带 用 于 医学 和 工业 成 像 ， 以 得 到 三 维 物体 的 剖面 (“ 切 片 ”) 图 像 ， 如 


> 图 2.14(b) 所 示 。 旋 转 的 K 射线 源 提供 照射 ， 射 线 源 对 面 的 传感器 则 收集 穿 过 物体 的 X 射线 能 量 (很 


明显 ， 这 些 传感器 必须 对 K 射线 敏感 ) 。 这 就 是 1.2 节 和 1.3.2 节 中 所 述 医 学 和 工业 计算 机 轴 向 断层 


5 
(CADT) 成 像 的 基础 。 注 意 ， 传 感 器 的 输出 必须 由 重建 算法 处 理 ， 重 建 算法 的 目的 是 把 感知 数据 转换 
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为 有 意义 的 前 面 图 像 ( 见 5.11 节 ) 。 换 句 话 说， 图 像 不 可 能 单 靠 传感器 的 运动 直接 得 到 ;需要 对 它们 做 
进一步 处 理 。 由 图 像 堆 释 组 成 的 三 维 数字 物体 是 由 物体 与 传感器 环 相互 垂直 运动 产生 的 。 基 于 CAT 原 
理 的 其 他 成 像 模式 包括 核磁 共振 成 像 (MRI) 和 正 电子 发 射 断层 (PET) 成 像 。 照 射 源 、 传 感 器 和 图 像 的 
类 型 是 不 同 的 ， 但 概念 上 它们 与 图 2.14 (b) 中 所 示 的 基本 成 像 方法 非常 相似 。 


aa 






图 2.14 (a) 使 用 一 个 线性 传感器 带 获取 图 像 ， (b) 使 用 一 个 环形 传感器 带 获 取 图 像 
2.3.3 使 用 传感器 阵列 获取 图 像 


图 2.12 (c) 显示 了 以 二 维 阵 列 形 式 排列 的 一 个 传感器 。 大 量 的 电磁 波 和 一 些 超声 波 传 感 装置 常 以 阵 
列 形 式 排列 。 这 也 是 我 们 在 数字 摄像 机 中 看 到 的 主要 排列 方式 。 这 些 摄像 机 的 典型 传感器 是 CCD 阵 
列 , 这 种 阵列 可 制造 为 具有 很 宽 范围 的 传 感 特 性 , 并 能 封装 为 具有 4000x4000 个 单元 或 更 多 单元 的 稳 
定 阵 列 。CCD 传感器 广泛 用 于 数字 摄像 机 和 其 他 光敏 设备 中 。 每 个 传感器 的 响应 正比 于 投射 到 传感器 
表面 的 光 能 总 量 ， 这 一 特性 被 用 于 天 文学 和 其 他 要 求 低 噪声 图 像 的 应 用 中 。 通 过 让 传感器 累积 输入 光 
信号 超过 几 分 钟 甚至 几 小 时 ， 可 达到 降低 噪声 的 目的 。 因 为 图 2.12(c) 所 示 的 传感器 阵列 是 二 维 的 ， 故 
其 主要 优点 是 通过 将 能 量 聚 焦 到 阵列 表面 ， 来 得 到 一 幅 完 整 的 图 像 。 很 明显 ， 前 面 讨论 的 传感器 排列 
的 运动 是 不 需要 的 。 

这 样 的 传感器 阵列 所 用 的 主要 方法 示 于 图 2.15。 该 图 显示 来 自 照射 源 的 能 量 是 场景 元 素 的 反射 (如 
本 节 开 始 提 到 的 那样 ， 该 能 量 也 可 以 通过 场景 元 素 透射 ) 。 图 2.15 (c) 所 示 成 像 系统 执行 的 第 一 个 功能 是 


收集 入 射 能 量 , 并 将 它 聚 焦 到 一 个 图 像 平面 上 。 如 果 照 射 的 是 光 ,出 成 像 [pp RD 
系统 的 前 端 是 一 个 光学 透镜 ， 该 透镜 把 观察 的 场景 投影 到 透镜 的 聚焦 平 |e gripes minnie. 
面 上 ， 如 图 2.15(d) 所 示 。 与 焦 平 面 重合 的 传感器 阵列 产生 与 每 个 传感器 

接收 到 的 光 总 量 成 正比 的 输出 。 数 字 或 模拟 电路 扫描 这 些 输 出 ， 并 把 它们 转换 成 模拟 信号 ， 然 后 由 成 像 系 


统 的 其 他 部 分 数字 化 ， 输 出 是 一 幅 数 字 图 像 ， 如 图 2.15 (e) 所 示 。 把 一 幅 图 像 转换 为 数字 形式 是 2.4 节 的 
主题 。 
在 处 理 过 程 中 或 是 作为 解 译 的 结 
2.3.4 简单 的 图 像 形 成 模型 果 ， 图 像 灰 度 可 以 为 负 值 例如 ， 


在 雷达 成 像 中 ， 移 向 雷达 系统 的 物 
正 像 在 1.1 节 中 介绍 的 那样 ， 我 们 用 形 如 f(x, y) 的 二 维 函数 来 。 | 体 通过 解释 为 速度 为 负 ， 而 远 高 雷 
表示 图 像 。 在 空间 坐标 (x, yb, /的 值 或 幅度 是 一 个 正 的 标量 ， 其 物 |= ee eee sone 
理 意 义 由 图 像 源 决 定 。 当 一 幅 图 像 由 物理 过 程 产生 时 ,其 亮度 值 正比 ”| 为 既 有 正 值 又 有 负 值 。 在 存储 和 显 
于 物理 源 (如 电磁 波 ) 所 辐 射 的 能 量 。 因 此 ， f(x, y) 一 定 是 非 零 的 和 ”| 示 图 像 时 ,我 们 通常 会 标定 灰 度 ， 
HRY, Bp 以 便 最 小 的 负 值 变 为 0( 灰 度 标定 将 
= ， 在 2.6.3 节 介绍 )。 
B 0< f(x,y) <0 (2.3-1) 
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(内 部 ) 图 像 平面 
图 2.15 “数字 图 像 获 取 过 程 的 一 个 例子 : (a) 能 量 (“ 照 射 ”) 源 ; (b) 场景 元 
ZB: (c) 成 像 系统 ; (O 场景 到 图 像 平 面 的 投影 ; (ce) 数字 化 后 的 图 像 


函数 f(x,y) 可 由 两 个 分 量 来 表征 : (1) 人 射 到 被 观察 场景 的 光源 照射 总 量 ; (2) 场景 中 物体 所 反射 
的 光照 总 量 。 这 两 个 分 量 分 别称 为 入 射 分 量 和 反射 分 量 ， 且 分 别 表示 为 i(x,y) 和 xr(x,y) 。 两 个 函数 的 
乘积 就 是 fx y)， 即 





I (x, y) = i(x, y)r(x, y) (2.3-2) 
式 中 ， 
0<ilx,y)<% (2.3-3) 
和 
0<r(x,y)<1 (2.3-4) 


式 (2.3-4) 指 出 反射 分 量 限制 在 0( 全 吸收 ) 和 1 (全 反射 ) 之 间 。i(x, y) 的 性 质 取决 于 照射 源 , 而 r(x,y) 的 
性 质 则 取决 于 成 像 物体 的 特性 。 注 意 ， 这 种 表示 方式 还 可 用 于 照射 光 通 过 媒介 形成 图 像 的 情况 ， 如 胸 
透 和 射线 照片 。 在 这 种 情况 下 ， 我 们 应 该 用 透射 系数 代替 反射 函数 ， 但 其 限制 应 该 与 式 (2.3-4) 相同 ， 
且 形 成 的 图 像 函 数 会 建 模 为 式 (2.3-2) 中 的 乘积 。 





刍 银 金属 为 re AAOS i 
仿 单 色 图 像 在 任何 坐标 (x, 为) 处 的 强度 ( 灰 度 ) 表 示 为 


2 = f (2.3-5) 
Hy xk (2.3-2) 到 式 (2.3-4) PJAN 2 的 取 值 范 围 为 : 
LS (2.3-6) 


min 


HEE, (LER Lyin WE, MER Len VAR KRE Loin = inin rin FU Linge = imaxinax o 参照 前 
面 提 到 的 办 公 室 的 平均 照度 和 反射 值 范围 , REE Lonin ~ 10 F Lra = 1000 作为 没有 附加 照明 的 室内 
值 的 典型 限制 。 

区 间 [Z ,二 ，] 称 为 灰 度 级 (或 强度 级 ) 。 实 际 情况 下 常 令 该 区 间 为 [0,L 一 1] ， 其 中 4 =0 为 黑色 ， | 


4= 工 -1 在 灰 度 级 中 为 白色 。 所 有 中 间 值 是 从 黑色 到 白色 之 间 变 化 的 灰 度 色调 。 am 
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24 图 像 取 样 和 量化 


由 前 一 节 的 讨论 ， 我 们 看 到 有 多 种 获取 图 像 的 方法 ， 但 在 所 有 这 些 方法 中 我 们 的 目的 是 相同 的 ， 
即 从 感知 的 数据 生成 数字 图 像 。 多 数 传感器 的 输出 是 连续 的 电压 波形 ， 
这 些 波形 的 幅度 和 空间 特性 都 与 感知 的 物理 现象 有 关 。 为 了 产生 一 幅 | 第 4 tp 
数字 图 像 ， 我 们 需要 把 连续 的 感知 数据 转换 为 数字 形式 。 这 种 转换 包 
括 两 种 处 理 : 取样 和 量化 。 


2.4.1 ”取样 和 量化 的 基本 概念 

图 2.16 说 明了 取样 和 量化 的 基本 概念 。 图 2.16(a) 显示 了 一 幅 连 续 图 像 /我们 想 把 它 转换 为 数字 
形式 。 一 幅 图 像 的 x 和 y 坐标 及 幅度 可 能 都 是 连续 的 。 为 将 它 转换 为 数字 形式 ， 必 须 对 坐标 和 幅度 都 
进行 取样 操作 。 对 坐标 值 进行 数字 化 称 为 取样 ， 对 幅 值 数 字 化 称 为 量化 。 
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图 2.16 “生成 一 幅 数字 图 像 : (a) 连续 图 像 ;(b) 连续 图 像 中 从 4 到 B 的 一 条 扫 
描 线 ， 用 于 说 明 取 样 和 量化 的 概念 ; 〈c) 取 样 和 量化 ; (d) 数字 扫描 线 


图 2.16 (b) 中 的 一 维 函数 是 图 2.16 (a) 中 沿线 段 AB 的 连续 图 像 幅 度 值 ( 灰 度 级 ) 的 曲线 。 随 机 变 
化 是 由 图 像 噪声 引起 的 。 为 了 对 该 函数 取样 ， 我 们 沿线 段 48 等 间隔 地 对 该 函数 取样 ， 如 图 2.16 (c) 
所 示 。 每 个 样本 的 空间 位 置 由 图 形 底 部 的 垂直 刻度 指出 。 样 本 用 函数 曲线 上 的 白色 小 方块 表示 。 这 
样 的 一 组 离散 位 置 就 给 出 了 取样 函数 。 然 而 ， 样 本 值 仍 垂直) 跨越 了 灰 度 值 的 连续 范围 。 为 了 形成 
数字 函数 , 灰 度 值 也 必须 转换 (量化 ) 为 离散 量 。 图 2.16 (c) 的 右 侧 显示 了 已 分 为 8 个 离散 区 间 的 灰 度 
标尺 ， 范 围 从 黑 到 白 。 垂 直 刻 度 标 记 指出 了 赋予 8 个 灰 度 的 每 个 特定 值 。 通 过 对 每 个 样本 赋予 8 个 
离散 灰 度 级 中 的 一 个 来 量化 连续 灰 度 级 。 赋 值 取决 于 该 样本 与 一 个 垂直 刻度 标记 的 垂直 接近 程度 。 
取样 和 量化 操作 生成 的 数字 样本 如 图 2.16(d) 所 示 。 从 该 图 像 的 顶部 开始 逐 行 执行 这 一 过 程 , 会 产生 
一 幅 二 维 数字 图 像 。 图 2.16 意味 着 除了 所 用 的 离散 级 数 外 ， 量 化 所 达到 的 精度 强烈 地 依赖 于 取样 信 
号 的 噪声 。 
ica 按 刚 才 讨论 的 方式 取样 ， 假 设 我 们 有 一 幅 在 两 个 坐标 方向 上 和 幅度 上 都 连续 的 图 像 。 实 践 中 ， 取 
I5) 样 方法 由 用 于 生成 该 图 像 的 传感器 配置 决定 。 如 图 2.13 所 示 ， 当 一 幅 图 像 由 单个 传 感 单元 与 机 械 运 动 
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相 结合 生成 时 ， 传 感 器 的 输出 可 用 前 面 讨论 的 方式 量化 。 然 而 ， 空 间 取 样 是 通过 选择 各 个 机 械 增 量 的 


数量 并 在 取样 处 激活 传感器 来 收集 数据 完成 的 。 机 械 运 动 可 以 非常 精确 地 实现 ， 因 此 从 原理 上 讲 , 使 
用 这 种 方法 对 一 幅 图 像 取样 可 以 到 达 的 精细 程度 并 没有 限制 。 实 践 中 ， 取 样 精度 的 限制 由 其 他 因素 决 
定 ， 壁 如 系统 的 光学 元 件 的 质量 。 

使 用 带 状 传感器 获取 图 像 时 ， 带 中 传感器 的 数量 决定 了 图 像 中 一 个 方向 上 的 限制 。 另 一 个 方向 上 
的 机 械 运动 可 控制 得 更 精确 一 些 ， 但 试图 在 一 个 方向 上 实现 超过 另 一 个 方向 上 被 传感器 数量 限制 的 取 
样 密度 是 没有 意义 的 。 对 传感器 输出 进行 量化 后 ， 就 完成 了 产生 数字 图 像 的 过 程 。 

传 感 阵列 用 于 图 像 获取 时 , 没有 运动 且 阵 列 
中 传感器 的 数量 决定 了 两 个 方向 上 的 取样 限制 。 
传感器 输出 的 量化 与 前 述 相同 。 图 2.17 说 明了 这 

Ro 图 2.17(a) 显示 了 投影 到 一 个 阵列 传感器 
平面 上 的 连续 图 像 。 图 2.17 (b) 显示 了 取样 和 量化 
后 的 图 像 。 很 明显 ， 数 字 图 像 的 质量 在 很 大 程度 
上 取决 于 取样 和 量化 中 所 用 的 样本 数 和 灰 度 级 。 N “E 
然而 ， 如 2.4.3 池 所 述 ， 在 选择 这 些 参 数 时 A ooo 
像 内 容 是 一 个 重要 的 考虑 因素 。 图 2.17 (9) 已 投影 到 一 个 传感器 阵列 上 的 连续 


总 £ ; $; 各 的 结果 
24.2 HERRER 图 像 ，(b) 图 像 取样 和 量化 后 的 


令 f(s,t) 表示 一 幅 具 有 两 个 连续 变量 s 和 上 的 连续 图 像 函数 。 如 前 一 节 解 释 的 那样 ， 通 过 取样 和 
量化 ,我 们 可 把 该 函数 转换 为 数字 图 像 。 假 设 我 们 把 这 幅 连 续 图 像 取样 为 一 个 二 维 阵列 f(x,y) ， 该 阵 
列 包含 有 M 行 和 N 列 ， 其 中 (x*,y) 是 离散 坐标 。 为 表达 清楚 和 方便 起 见 ， 我 们 对 这 些 离散 坐标 使 用 整 
BUH: x= 0,1 2;…,M -1 和 yy=0,12…,N-1l。 XIE, 数字 图 像 在 原点 的 值 就 是 f(0,0) , 第 一 行 中 
下 一 个 坐标 处 的 值 是 f(0,1) 。 这 里 , 符号 (0,1) 表示 第 一 行 的 第 二 个 样本 ， 它 并 不 是 对 图 像 取样 时 的 物 
理 坐 标 值 。 通 常 ， 图 像 在 任何 坐标 (x,y) 处 的 值 记 为 /(x,y) ， 其 中 x Al y 都 是 整数 。 由 一 幅 图 像 的 坐 
标 张 成 的 实 平面 部 分 称 为 空间 域 ，x 和 yy 称 为 空间 变量 或 空间 坐标 。 

如 图 2.18 所 示 ， 有 三 种 基本 方法 表示 f(x, y)。 图 2.18 (a) 是 一 幅 函 数 图 ， 它 用 两 个 坐标 轴 决 定 空间 
位 置 , 第 三 个 坐标 是 以 两 个 空间 变量 x Aly A PRPC FORE) 值 。 虽 然 我 们 可 以 在 这 个 例子 中 用 该 图 来 
推断 图 像 的 结构 ， 但 通常 复杂 的 图 像 细 节 太 多 ， 以 至 于 很 难 由 这 样 的 图 像 去 解 译 。 在 处 理 的 元 素 是 以 
(x, yz) 三 坐标 的 形式 表达 的 灰 度 集 时 ,这 种 表示 是 很 有 用 的 ,其 中 x 和 yy 是 空间 坐标 ,z 是 /在 坐标 (x,y) 
处 的 值 。 在 2.6.4 节 中 ， 我 们 将 探讨 这 种 表示 。 

Al 2.18 (b) 是 更 一 般 的 表示 。 它 显示 了 了 (x,y) 出 现在 监视 器 或 照片 上 的 情况 。 这 里 ， 每 个 点 的 灰 
度 与 该 点 处 的 f 值 成 正比 。 图 中 仅 有 三 个 等 间隔 的 灰 度 值 。 如 果 灰 度 被 归 一 化 到 区 间 [0, 1] 内 ， 那 么 图 
像 中 每 个 点 的 灰 度 都 有 0, 0.5 或 1 这 样 的 值 。 监 视 器 或 打印 机 简单 地 把 这 三 个 值 分 别 变 换 为 黑色 、 灰 
色 或 白色 ， 如 图 2.18 (b) 所 示 。 第 三 种 表示 是 将 f(x,y) 的 数值 简单 地 显示 为 一 个 阵列 (矩阵 ) 。 在 这 个 
例子 中 , f 的 大 小 为 600x600 个 元 素 , BK 360000 个 数字 。 很 清楚 ,打印 整个 矩阵 是 很 麻烦 的 ， 且 传达 
的 信息 也 不 多 。 人 然而， 在 开发 算法 时 ， 当 图 像 的 一 部 分 被 打印 并 作为 数值 进行 分 析 时 ， 这 种 表示 相当 
有 用 。 图 2.18(c) 以 图 形 方式 传达 了 这 一 概念 。 

由 前 面 几 节 的 讨论 ， 我们 可 得 出 一 个 结论 ， 即 图 2.18 (b) 和 图 2.18(c) 中 的 表示 是 最 有 用 的 。 图 像 








” 显示 人 允许 我 们 快速 地 观察 结果 。 数 值 阵 列 用 于 处 理 和 算法 开发 。 以 公式 形式 ， 我 们 可 将 一 个 MxN 的 


数值 阵列 表示 为 
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£(0, 0) f(0, 1) E f0, N51) 
,0 dl ona 1,N-1 
I(x, y)= yu : ey i si i À 41) . 
f(M -1, 0) (M ~1, 1) x f(M -1, N-1) 


该 式 的 两 边 以 等 效 的 方式 定量 地 表达 了 一 幅 数 字 图 像 。 右 边 是 一 个 实数 和 矩阵， 矩阵 中 的 每 个 元 素 称 为 
图 像 单 元 、 图 像 元 素 或 像素 。 图 像 和 像素 这 两 个 术语 将 在 全 书 中 表示 数字 图 像 及 其 元 素 。 


abe TEAR 





0000000---0000000 
000000 000000 
原点 00000 00000 
GROAN 0000 
y QO ws 000 
000 aS 000 
í 5 i 
š . ‘ah eu i 5 
了 ‘1 : 
000 1 000 
000 2 000 
0000 0000 
00000 00000 
000000 000000 
有 0000000---0000000 
图 2.18 (a) 画 为 表面 图 形 的 图 像 ; (b) 显示 为 可 视 灰 度 阵 列 的 图 像 ; (c) 显示 
为 一 个 二 维 数值 阵列 的 图 像 (0, 0.5 和 1 分 别 表示 黑色 、 灰 色 和 白色 ) 
在 某 些 讨论 中 ， 使 用 传统 的 矩阵 表示 法 来 表示 数字 图 像 及 其 像素 更 为 方便 : 
40,0 4,1 uae 4, N-1 
ya Aa i wee Sa (2.4-2) 
Udy-1,0 ay) e QM -1, N=1 


WR, ay = f(x=i,y = f)= (li, 让， 因此 式 (2.4-1) 和 式 (2.4-2) 是 相同 的 矩阵 。 我 们 甚至 可 将 一 幅 图 像 
表示 一 个 向 量 y。 例 如， 尺寸 为 MNx 1 的 列 向 量 由 v 的 前 WY 个 元 素 作为 4 的 第 一 列 来 构成 ， 其 后 的 M 
个 元 素 作为 第 二 列 ， 等 等 。 我 们 也 可 使 用 4 的 行 代替 列 来 形成 这 样 的 一 个 向 量 。 只 要 一 致 ， 哪 种 表示 
都 是 有 效 的 。 

简要 地 回顾 图 2.18， 注 意 到 ,数字 图 像 的 原点 位 于 左上 角 ， 其 中 正 x 轴 向 下 延伸 ， 正 y 轴 向 右 延 
伸 。 这 种 方便 的 表示 基于 如 下 事实 : 许多 图 像 显示 (譬如 电视 显示 器 ) 扫描 都 是 从 左上 角 开 始 的 ， 然 后 
一 次 向 下 移动 一 行 。 更 重要 的 事实 是 , 矩阵 的 第 一 个 元 素 按 惯例 应 在 阵列 的 左上 角 ， 因 此 将 f(x,y) 的 
原点 选择 在 左上 角 数 学 上 行 得 通 。 记 住 , 这 种 表示 是 我 们 所 熟悉 的 标准 右手 笛 卡 儿 坐 标 系统 2。 我 们 仅 
说 明了 指向 下 方 和 指向 右 方 的 坐标 轴 来 代替 向 右 和 向 上 的 坐标 轴 。 

有 时 , 以 更 正式 的 数学 术语 表达 取样 和 量化 可 能 会 很 有 用 。 令 Z AR 分 别 表示 整数 集 和 实数 集 。 
取样 处 理 可 视 为 把 x 平面 分 为 网 格 的 过 程 ， 网 格 中 每 个 单元 的 中 心 坐标 是 笛 卡 儿 积 Z? 中 的 一 对 元 
K, Z 是 所 有 有 序 元 素 对 (z,,z,) 的 集合 ，z, 和 zz 是 Z 中 的 整数 。 因此， 如 果 (x,y) 是 Z? 中 的 整数 ， 
且 f 是 把 灰 度 值 ( 即 实 数 集 R 中 的 一 个 实数 ) 赋 给 每 个 特定 坐标 对 (x,y) 的 一 个 函数 , 则 f(x,y) 就 是 


D 回忆 可 知 ， 右 手 坐 标 系统 是 这 样 一 种 系统 : 当 正 x 轴 方 向 向 右 时 ， 在 大 拇指 竖 直 向 上 时 ， 正 y 轴 的 方向 为 垂直 于 x 轴 的 中 指 方 


向 。 如 图 2.18 (a) 所 示 ， 事 实 上 这 是 我 们 的 图 像 坐标 系统 情形 。 
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一 幅 数字 图 像 。 显 然 , 这 种 赋值 过 程 就 是 前 面 描述 的 量化 处 理 。 如 果 灰 度 级 也 是 整数 (此 时 及 后 续 章节 
中 通常 为 这 种 情况 ) ， 则 用 乙 代 替 R， 然 后 ,数字 图 像 变 成 一 个 二 维 本 
数 ， 且 其 坐标 和 幅 什 都 是 整数 。 i AGL REHEAT 1 

数字 化 过 程 要 求 针对 M 值 、N 值 和 离散 灰 度 级 数 工 做 出 判定 。 对 “| nf eae eee ee eric 
于 MM 和 NN， 除 了 必须 取 正 整数 外 没有 其 他 限制 。 然 而 ， 出 于 存储 和 量 |F, 这些 值 都 会 被 缩放 到 用 于 图 像 存 


化 硬件 的 考虑 ， 灰 度 级 数 通常 取 为 2 WERE, BI 储 和 显示 的 整数 区 间 [0, L-1]. 
L=2" (2.4-3) 
我 们 假设 离散 灰 度 级 是 等 间隔 的 , 且 它 们 是 区 间 [0, 2-1] 
内 的 整数 。 有 时 , 灰 度 跨越 的 值 域 非 正式 地 称 为 动态 范 
围 。 这 一 术语 在 不 同 的 场合 有 不 同 的 用 法 。 这 里 ， 我 们 
将 图 像 系 统 的 动态 范围 定义 为 系统 中 最 大 可 度量 灰 度 与 
最 小 可 检测 灰 度 之 比 。 原 则 上 ， 上 限 取决 于 饱和 度 ， 下 
BRP OLK 2.19) 。 基 本 上 ， 动 态 范围 由 系统 能 
表示 的 最 低 和 最 高 灰 度 级 来 确定 ， 因 此 ， 这 也 是 图 像 具 
有 的 动态 范围 。 与 这 一 概念 紧密 联系 的 是 图 像 对 比 度 ， 
我 们 将 一 幅 图 像 中 最 高 和 最 低 灰 度 级 间 的 灰 度 差 定义 为 
对 比 度 。 当 一 幅 图 像 中 像素 可 感知 的 数值 具有 高 动态 范 “图 2.19 显示 了 人 饱和 度 和 噪声 的 一 幅 图 像 . 饱和 度 是 指 








围 时 ， 那 么 我 们 认为 该 图 像 具有 高 对 比 度 。 相 反 ， 具 有 超过 这 个 值 的 灰 度 级 将 被 关切 撞 的 一 个 最 高 
低 动态 范围 的 图 像 很 沉闷 ， 看 上 去 灰 度 被 冲淡 。 第 3 章 2 de elves aedeagal 


这 种 情况 下 的 噪声 表现 为 粒状 纹理 模式 。 品 


kin P, DEEBA ee ee es 
FE Ht eae PAOURE, Hea HTN fee 
b=MxNxk (2.4-4) 


当 M = NM 时 ， 该 式 变 为 
b=N°k (2.4-5) 
表 2.1 中 显示 了 N 和 大 取 不 同 值 时 需要 用 来 存储 方形 图 像 的 比特 数 。 括 号 中 的 数字 表示 对 应 于 每 个 大 
值 的 灰 度 级 数 。 当 一 幅 图 像 有 六 个 灰 度 级 时 ， 实 际 上 通常 称 该 图 像 为 一 幅 “a 比特 图 像 ”。 例 如 ， 有 
256 个 可 能 的 离散 灰 度 值 的 图 像 称 为 8 比特 图 像 。 注 意 ， 大 小 为 1024x1024 或 更 高 的 8 比特 图 像 的 存 
储 需 求 很 大 。 
R21 NN 和 kk 取 不 同 值 时 存储 所 需 的 比特 数 。L 是 灰 度 级 数 


N/K 1(L=2) 2(L=4 3(L=8) 4(L=16) 5(L = 32) 6(L= 64) 7(L = 128) 8(L = 256) 








32 1 024 2 048 3 072 4096 5120 6 144 7 168 8 192 
64 4 096 8 192 12 288 16 384 20 480 24 576 28 672 32 768 
128 16 384 32 768 49 152 65 536 81 920 98 304 114 688 131 072 
256 65 536 131 072 196 608 262 144 327 680 393 216 458 752 524 288 


512 262 144 524 288 786 432 1 048 576 1 310 720 1 572 864 1 835 008 2 097 152 
1024 1048576 2097152 3145728 4 194 304 5 242 880 6 291 456 7 340 032 8 388 608 
2048 4194304 8388608 12582912 16777216 20971520 25 165824 29 369 128 33 554 432 
4096 16777216 33554432 50,331648 67,108,864 83886080 100663296 117440512 134217728 
8192 67 108 864 134217728 201326592 268,435,456 335544320 402653184 469762048 536870912 


79] 


81 


81 


34 数字 图 像 处理 (第 三 版 ) 


2.4.3 ”空间 和 灰 度 分 辨 率 


直观 上 看 ， 空 间 分 辩 率 是 图 像 中 可 辨别 的 最 小 细节 的 度量 。 在 数量 上 ， 空 间 分 辩 率 可 以 有 很 多 “ 
方法 来 说 明 ， 其 中 单位 距离 的 线 对 数 和 单位 距离 的 点 数 (像素 数 ) 是 最 通用 的 度量 。 假 设 我 们 用 交替 


出现 的 黑色 和 白色 垂 线 来 构造 一 幅 图 形 ， 其 中 线 宽 为 下 个 单位 (下 可 以 小 于 1)。 线 对 的 宽度 是 2W, 


单位 距离 内 有 1/2W 个 线 对 。 例如 ， 如果 一 条 线 的 宽度 是 0.1 mm, 那么 单位 距离 (mm) 内 就 有 5 个 线 
对 。 广 泛 使 用 的 图 像 分 辩 率 的 定义 是 单位 距离 内 可 分 辨 的 最 大 线 对 数量 ( 壁 如 每 毫米 100 个 线 对 ) 。 
单位 距离 的 点 数 是 印刷 和 出 版 业 中 常用 的 图 像 分 辩 率 的 度量 。 在 美国 ， 这 一 度量 通常 使 用 每 英寸 点 
数 (dpi) 来 表示 。 例 如 ， 为 大 到 处 了 解 质量 的 概念 ， 报 纸 用 75 dpi 的 分 辨 率 来 印刷 ， 杂 志 则 采用 133 
dpi 的 分 辨 率 ， 光 鲜 小 册子 采用 175 dpi 的 分 辩 率 ， 我 们 正在 阅读 的 书页 则 是 以 2044 dpi 的 分 辩 率 印 
刷 的 。 

前 一 段 中 的 关键 点 是 空间 分 辩 率 的 度量 必须 针对 空间 单位 来 规定 才 有 意义 。 图 像 大 小 本 身 并 不 会 
告诉 我 们 全 部 内 容 。 如 果 没 有 规定 图 像 包含 的 空间 维 数 ， 那 么 我 们 说 一 幅 图 像 的 分 辩 率 为 1024x1024 
像素 是 没有 意义 的 。 尺 寸 本 身 只 在 比较 图 像 容量 时 才 有 和 帮助。 例如, 带 有 20 兆 像素 成 像 芯 片 的 CCD 
数字 摄像 机 与 8 兆 像素 的 摄像 机 相 比 ， 有 较 高 分 辩 细 节 的 能 力 ， 假 定 两 部 摄像 机 都 配备 了 可 比较 的 镜 
头 ， 并 在 相同 的 距离 拍摄 可 比较 的 图 像 。 

类 似 地 ， 灰 度 分 状 率 是 指 在 灰 度 级 中 可 分 辨 的 最 小 变化 。 我 们 有 关于 产生 数字 图 像 的 样本 数 
的 判断 ， 但 对 于 灰 度 级 来 说 这 并 不 适用 。 基 于 硬件 考虑 ， 如 前 节 所 述 ， 灰 度 级 数 通 常 是 2 的 整数 
次 震 。 最 通用 的 数 是 8 比特 ， 在 某 些 特 殊 的 图 像 增强 应 用 中 ,用 16 比特 也 是 必要 的 。 灰 度量 化 用 
32 比特 则 很 罕见 。 有 时 ， 我 们 会 发 现 使 用 10 比特 或 12 比特 来 数字 化 图 像 灰 度 级 的 系统 ， 但 这 些 
系统 都 是 特例 而 非常 规 系统 。 不 像 空间 分 辨 率 必 须 以 单位 距离 为 基础 才 有 意义 ， 灰 度 分 辩 率 指 的 
则 是 用 于 量化 灰 度 的 比特 数 。 例 如 ， 通 常 说 一 幅 被 量化 为 256 级 的 图 像 有 8 比特 的 灰 度 分 辩 率 。 因 
为 灰 度 中 可 分 辩 的 真实 变化 不 仅 受 噪声 和 饱和 度 值 的 影响 ， 也 受 人 类 感知 能 力 的 影响 ( 见 2.1 节 ) , 
因此 8 比特 灰 度 分 辩 率 的 一 幅 图 像 所 含 的 内 容 ， 并 不 比 用 固定 灰 度 值 增 量 1/256 来 量化 为 8 比特 的 
系统 更 多 。 

下 面 的 两 个 例子 分 别 说 明了 图 像 尺寸 和 灰 度 分 辨 率 对 分 辨 细节 的 影响 。 在 本 节 稍 后 ， 我 们 将 讨论 
决定 感知 图 像 质量 中 的 两 个 参数 是 如 何 相互 影响 的 。 


例 2.2 ”降低 图 像 空间 分 辩 率 的 效果 说 明 。 

图 2.20 显示 了 降低 一 幅 图 像 的 空间 分 辩 率 的 效果 。 图 2.20(a) 到 (d) 显示 了 分 辩 率 分 别 为 1250 dpi, 
300 dpi, 150 dpi 和 72 dpi 的 图 像 。 显然， 低 分 辩 率 的 图 像 与 原 图 像 相 比 要 小 。 例 如 ， 原 图 像 的 大 小 为 
3692x2812 像素 ， 但 72 dpi 图 像 是 一 个 大 小 为 213x162 的 阵列 。 为 便于 细节 的 比较 ， 所 有 小 图 像 都 放大 
到 了 原 图 像 大 小 (采用 2.4.4 节 中 讨论 的 放大 方法 ) 。 

图 2.20(a) 和 图 2.20 (b) 之 间 有 一 些 较 小 的 视觉 差别 ， Pe ie an 
图 2.20 (b) 的 大 部 分 还 是 可 以 接受 的 。 事 实 上 ，300 dpi 是 书籍 印刷 所 用 的 最 小 空间 分 辩 率 。 因此 ， 这 里 我 
们 不 能 期 望 看 到 很 大 的 不 同 。 图 2.20(c) 显示 了 可 见 的 退化 (例如 ， 计时 器 的 圆 形 边缘 和 右 侧 指向 60 处 的 小 
€t) . 图 2.20(d) 显示 了 图 像 中 多 数 可 见 特征 的 退化 。 如 4.5.4 节 中 讨论 的 那样， 当 以 这 样 低 的 分 辩 率 印刷 时 ， 
印刷 和 出 版 业 会 使 用 一 些 “ 技 巧 ”( 例 如 , 像素 尺寸 的 局 部 变化 ) 来 产生 比 图 2.20 AEE 此 外 ,如 
2.4.4 节 所 示 ， 选 择 所 用 的 内 插 方 法 也 可 以 改进 图 2.20 的 结果 。 


G23 ”改变 数字 图 像 中 灰 度 级 数 的 典型 效果 。 
在 这 个 例子 中 ， 我 们 保持 样本 数 恒定 ， 而 将 灰 度 级 数 以 2 的 整数 次 宕 从 256 减少 到 2, 图 2. 21(a) 是 一 
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幅 大 小 为 452x374 的 CT 投影 图 像 ， 它 以 上 = 8(256 个 灰 度 级 ) 显 示 。 这 样 的 图 像 是 通过 将 义 射线 源 固定 
在 一 个 位 置 ， 然 后 在 任何 期 望 的 方向 生成 二 维 图 像 来 得 到 的 。 投影 图 像 用 于 指导 设置 CT 扫描 仪 的 参数 ， 
包括 倾角 、 切 片 数 和 范围 : 

图 2.21 (b) 到 图 2.21 (hb) 是 在 保持 图 像 大 小 为 432x374 像素 不 变 的 情况 下 ， 比 特 数 从 =7 减 小 到 / k=1 
时 得 到 的 图 像 。256 级 .128 级 和 6 级 灰 度 图 像 对 于 所 有 实用 目的 在 视觉 上 的 效果 是 相同 的 -然而 ,图 2.21 (d) 
所 示 的 32 灰 度 级 图 像 中 ,在 恒定 或 接近 恒 度 灰 度 区 域 (尤其 在 头盖骨 处 ) 内 有 一 组 不 易 察 觉 的 细小 脊 状 结 
构 。 这 种 效果 是 由 数字 图 像 的 平滑 区 域 中 的 灰 度 级 数 不 足 引 起 的 ， 通常 称 为 伪 轮 廓 ， 之 所 以 这 样 称呼 ， 是 
办 为 这 些 疹 状 结构 关 似 于 地 图 中 的 地 形 欠 肇 。 伪 纶 计 通 党 在 以 16 SEA > mba 
像 中 十 分 明显 ;如 图 2.21 (e) 到 图 2.21 (b) 所 示 的 图 像 。 ae 

为 方便 起 见 ， AMAL DONEC | NORE Hosen ee oat vee. 印刷 
在 5 cm x 5 cm 版 式 上 的 图 像 ， 是 具有 最 低空 间 和 灰 度 分 辩 率 的 图 像 ， 没 有 令 人 讨厌 的 取样 棋盘 格 和 
伪 轮 廓 。 


















abcd 














图 2 各 降低 空 ; 间 分 辩 率 的 典型 效果 。 ERS SH (a) 1250 dpi, (b) 300 dpi, (c) 150 dpi, 
(d) 72 dpi 来 显示 。 为 清楚 起 见 ， 图 像 添加 了 黑色 的 细 边 框 ， 它 们 不 是 数据 的 一 部 分 








图 2.21 (a) 大 小 为 452x374 的 256 灰 度 级 图 像 ; (b)~(d) 保持 图 像 大 小 不 变 的 同时 以 灰 
度 级 128, 64 Al 32 显示 的 图 像 ;(e)~(h) 以 16,8,4 和 2 灰 度 级 显示 的 图 像 ( 原 图 像 
由 Vanderbilt 大 学 医学 中 心 辐射 学 与 放射 学 系 的 David R. Pickens 博士 提供 ) 
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例 2.2 和 例 2.3 中 的 结果 说 明了 分 别 改 变 W 和 上 时 对 图 像 质量 产生 的 影响 。 然 而 ， 这 些 结果 也 仅 
仅 部 分 地 回答 了 改变 W 和 大 如 何 影响 图 像 的 问题 ， 因 为 我 们 还 未 考虑 这 两 个 参数 之 间 可 能 存在 的 任何 
关系 。Huang[1965] 早 期 的 研究 试图 通过 实验 来 量化 同时 改变 N 和 大 时 对 图 像 质量 所 产生 的 影响 。 实验 
由 一 组 主观 测试 组 成 , 采用 了 类 似 于 图 2.22 中 所 示 的 图 像 。 妇 女 脸庞 图 像 是 包含 较 少 细节 的 代表 性 图 
像 ， 摄 像 师 图 像 包含 了 中 等 程度 的 细节 ， 人 群 图 像 相 比 之 下 包含 有 大 量 的 细节 。 





(图 像 由 麻 省 理工 学 院 提供 ) ; (c) 具有 大 量 细节 的 图 像 


通过 改变 N 和 上， 生成 了 这 三 种 类 型 的 一 组 图 像 ， 
然后 要 求 观察 者 主观 地 按 图 像 的 质量 对 图 像 排 序 。 最 终 
结果 以 Nk 平面 中 的 等 偏爱 曲线 形式 汇总 (图 2.23 中 显示 
了 对 应 于 图 2.22 中 图 像 的 平均 等 偏爱 曲线 ) 。MK 平 面 中 的 
每 一 点 表示 一 幅 图 像 , 该 图 像 的 X 值 和 大 值 等 于 该 点 的 
坐标 。 位 于 等 偏 受 曲线 上 的 点 对 应 于 有 相等 主观 判定 质 
量 的 图 像 。 实 验 发 现 等 偏爱 曲线 倾向 于 向 右上 方 移动 ， 
但 这 三 类 图 像 的 等 偏爱 曲线 形状 与 图 2.23 中 所 示 的 那些 
曲线 类 似 。 这 并 不 意外 ， 因 为 曲线 向 右上 方 移动 仅 意 味 
着 更 大 的 N 值 和 k 值 ， 而 这 又 意味 着 更 好 的 图 像 质量 。 

当前 讨论 内 容 的 关键 是 当 图 像 中 的 细节 增加 时 ， 等 
偏爱 曲线 会 变 得 更 加 垂直 。 这 一 结果 表明 ， 对 于 有 大 量 32 Aa EPAR 
细节 的 图 像 ， 可 能 只 需要 较 少 的 灰 度 级 。 例 如 ， 图 2.23 223 222 中 三 类 图 像 的 典型 等 偏爱 曲线 
中 对 应 于 人 群 图 像 的 等 偏爱 曲线 接近 垂直 。 这 表明 当 N 
值 固 定时 ， 这 类 图 像 的 感觉 质量 与 所 用 灰 度 级 数 ( 对 于 图 2. 23 所 示 的 灰 度 级 范围 ) 近似 无 关 。 更 有 趣 的 
是 ， 还 要 注意 ， 另 两 类 图 像 在 样本 数 增加 的 某 些 间 隔 内 ， 感 觉 质 量 保持 相同 ， 但 灰 度 级 数 实际 上 降低 
了 。 对 于 这 一 结果 , 最 可 能 的 原因 是 大 的 减 小 倾向 于 对 比 度 的 明显 增加 ， 人 们 通常 感受 到 图 像 质量 改 
善 了 的 视觉 效果 。 


2.4.4 图 像 内 插 


内 插 是 在 诸如 放大 、 收 缩 、 旋 转 和 几何 校正 等 任务 中 广泛 应 用 的 基本 工具 。 本 节 的 主要 目标 是 
介绍 内 插 并 用 它 调整 图 像 的 大 小 (收缩 和 放大 ) ， 这 是 基本 的 图 像 重 取样 方法 。 在 诸如 旋转 和 几何 校 
正 的 应 用 中 ,内 插 的 用 法 将 在 2.6.5 节 讨 论 。 在 第 4 章 ,我 们 还 将 回 到 这 一 主题 ， 以 详细 地 讨论 图 像 
重 取样 。 

本 质 上 ， 内 插 是 用 已 知 数据 来 估计 未 知 位 置 的 数值 的 处 理 。 我 们 用 一 个 简单 的 例子 开始 讨论 这 一 
话题 。 假 设 一 幅 大 小 为 500x500 像素 的 图 像 要 放大 1.5 倍 到 750x750 像 素 。 一 种 简单 的 放大 方法 
是 创建 一 个 假想 的 750x750 网 格 ， 它 与 原始 图 像 有 相同 的 间隔 ， 然 后 将 其 收缩 ， 使 它 准 确 地 与 原 
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图 像 匹配 。 显 然 ， 收 缩 后 的 750x750 网 格 的 像素 间隔 要 小 于 原 图 像 的 像素 间隔 。 为 了 对 覆盖 的 每 
个 点 赋 以 灰 度 值 ， 我 们 在 原 图 像 中 寻找 最 接近 的 像素 ， 并 把 该 像素 的 灰 度 赋 给 750x750 网 格 中 的 
新 像素 。 完 成 对 网 格 中 覆盖 的 所 有 点 的 灰 度 赋值 后 ， 就 把 图 像 扩展 到 原来 规定 的 大 小 ， 得 到 放大 
后 的 图 像 。 

刚刚 讨论 的 方法 称 为 最 近邻 内 插 ， 因 为 这 种 方法 把 原 图 像 中 最 近邻 的 灰 度 赋 给 了 每 个 新 位 置 (2.5 
节 将 正式 讨论 邻近 像素 ) 。 这 种 方法 简单 ， 但 本 节 稍 后 将 表明 该 方法 有 产生 不 希望 的 人 为 缺陷 的 倾向 ， 
如 某 些 直 边缘 的 严重 失真 。 由 于 这 一 原因 ， 实 际 上 该 方法 并 不 常用 。 更 实用 的 方法 是 双 线 性 内 插 ， 在 
该 方法 中 , 我 们 用 4 个 最 近邻 去 估计 给 定位 置 的 灰 度 。 令 (x, y) 为 我 们 想 要 赋 以 灰 度 值 的 位 置 (把 它 想 
象 为 前 面 描述 的 网 格 点 ) 的 坐标 ， 并 令 v(x, y) 表示 灰 度 值 。 对 于 双 线 性 内 插 来 说 ， 赋 值 是 由 下 面 的 公 


4 I] 。 
式 得 到 的 ; 与 该 方法 名 称 相反 的 是 , 双 线性 内 


v(x, y)=ax+by+oxy+d (2.4-6) | eA, EA 


式 中 ，4 个 系数 可 用 由 点 (x,y) 的 4 个 最 近邻 点 写 出 的 未 知 方程 确定 。 
正如 我 们 马上 将 看 到 的 那样 ， 双 线性 内 插 给 出 了 比 最 近邻 内 插 好 得 多 的 结果 ， 但 随 之 而 来 的 是 计算 
量 的 增加 。 

下 一 种 复杂 度 较 高 的 方法 是 双 三 次 内 插 ， 它 包括 16 个 最 近邻 点 。 赋 予 点 x, y) 的 灰 度 值 是 使 用 下 
式 得 到 的 : 


HEA xy 项 。 





v(x, y) = Mya ty! (2.4-7) 
i=0 j=0 
RP, 16 个 系数 可 用 由 点 (x, 的 16 个 最 近邻 点 写 出 的 未 知 方程 确定 。 观 察 式 (2.4-7) ， 如 果 求 和 
的 上 下 限 分 别 为 0 和 1， 则 其 简化 为 式 (2.4-6) 的 形式 。 通 常 ， 双 三 次 内 插 在 保持 细节 方面 比 双 线 
性 内 插 相 对 要 好 。 双 三 次 内 插 是 商业 图 像 编 辑 程 序 如 Adobe Photoshop 和 Corel Photopaint 的 标准 
内 插 方法 。 









到 72 dpi( 大 小 由 kh i 
到 的 。 图 raa ni 


SERENADE oo HAAR 
ela 


i 


此 的 结果 。 


和 
以 得 到 比 刚刚 讨论 的 方法 更 好 的 结果 。 对 于 三 维 图 形 (Watt[1993]，Shirley[2002]) 和 医学 图 像 处 理 
。(Lehmann et al.[1999])， 保 留 精细 细节 特别 重要 ， 而 对 于 普通 数字 图 像 处 理 , 较 少 考虑 额外 的 计算 
负担 是 合理 的 ， 所 以 双 线 性 内 插 和 双 三 次 内 插 是 人 们 选择 的 典型 方法 。 
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图 2.24 (a) 降低 到 72 dpi， 并 使 用 双 线 性 内 插 方法 将 其 放大 到 原 大 小 (3692x2812 像素 ) 的 图 像 。 该 
图 像 与 图 2.20(d) 相同 ; (b) 使 用 双 线 性 内 插 收 缩 和 放大 的 图 像 ; (c) 与 图 像 人 b) 相同 但 使 用 
双 三 次 内 播 的 图 像 ，(d) ~ 名 相 同 的 图 像 序列 ， 但 它们 是 收缩 到 150 dpi 而 不 是 收缩 到 72 dpi 
的 图 像 [图 2.24 (d) 与 图 2.20(c) 相同] 。 将 图 2.24(e) 和 全 与 原 图 2.20 (a) 比较 ， 特 别 是 后 者 


2.5 像素 间 的 一 些 基 本 关系 


本 节 介 绍 数字 图 像 中 像素 间 的 几 个 重要 关系 。 如 前 所 述 ， 图 像 由 f(x,y) 表示 。 本 节 中 引用 某 个 特 
殊 的 像素 时 ,我 们 通常 使 用 小 写字 母 ， 如 p 和 g。 


2.5.1 FARR 
位 于 坐标 (x,y) 处 的 像素 p 有 4 个 水 平和 垂直 的 相 邻 像素 ， 其 坐标 是 
(x+1, y), G1 y), (x, y+), (x, y-)) 
这 组 像素 称 为 忆 的 4 41%, HN, (p) 表示 。 每 个 像素 距 (x, y) 一 个 单位 距离 ， 如 果 (x,y) 位 于 图 像 的 边 


FE, WM p 的 某 些 相 邻 像素 位 于 数字 图 像 的 外 部 。 我 们 将 在 第 3 章 处 理 这 个 问题 。 
Pp 的 4 个 对 角 相 邻 像素 的 坐标 是 


(x+1, y+1), (x+1, y—1), (x—1, y+1), (x—1, y-D 
用 Np(p) 表 示 。 这 些 点 与 4 个 邻 点 一 起 称 为 p 的 8 邻 域 , 用 Ns) 表示。 与 前 面 一 样 ， 如 果 (x,y) 位 于 
图 像 的 边界 上 ， 则 N, (p) FN, (p) 中 的 某 些 邻 点 会 落 入 图 像 的 外 边 。 


2.5.2 ”邻接 性 、 连 通 性 、 区 域 和 边界 
令 广 是 用 于 定义 邻接 性 的 灰 度 值 集合 。 在 二 值 图 像 中 ， 如 果 把 具有 1 值 的 像素 归 诸 于 邻接 像素 ， 则 


S| y= (1). 在 灰 度 图 像 中 , 概念 是 _ 样 的 , 但 集合 一般 包含 有 更 多 的 元 素 . 例如 , 灰 度 信 范 围 为 0 到 255 





90 的 邻接 像素 中 ， 集 合 六 可 能 是 这 256 个 值 的 任何 一 个 子 集 。 考 虑 三 种 类 型 的 邻接 : 
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(a) 4 邻接 。 如果 4 在 集合 Ns(p) 中 , 则 具有 入 中 数值 的 两 个 像素 
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我 们 分 别 使 用 符号 站 和 U 来 表示 


了 和 g 是 4 邻接 的 。 集合 的 交 与 并 。 假设 有 集合 4 和 B， 
(b) 8 邻接。 如果 qg 在 集合 Ns(p) P, 则 有 具有 六 中 数值 的 两 个 像素 | 回忆 可 知 它们 的 交集 是 既 在 集合 4 中 
p 和 q 是 8 邻接 的 。 又 在 集合 B 中 的 成 员 的 元 素 集 。 这 两 


个 集合 的 并 集 是 集合 A 的 成 员 、 集合 
B 的 成 员 或 两 者 的 成 员 的 元 素 集 。 详 
细 讨 论 见 2.6.4 节 。 


(c) m 邻接 (混合 邻接 ) 。 如 果 ( 人 9 在 N,(p) F, RG) g ÆN, p) P, 
HREN MAN, a) 中 没有 来 自 入 中 数值 的 像素 , 则 具有 V 
中 数值 的 两 个 像素 p 和 g 是 m 邻接 的 。 


混合 邻接 是 8 邻接 的 改进 。 混 合 邻接 的 引入 是 为 了 消除 采用 8 邻接 时 产生 的 二 义 性 。 例 如 ， 考 虑 
图 2.25 (a) 中 对 于 天 = {1} 的 像素 排列 。 位 于 图 2.25 (b) 上 部 的 3 个 像素 显示 了 多 重 (二 义 性 )8 邻接 ， 如 
虚线 所 示 。 这 种 二 义 性 可 以 通过 m 邻接 消除 ， 如 图 2.25 (c) 所 示 。 

从 具有 坐标 (x,y) 的 像素 p 到 具有 坐标 0 





本 0 Ti Q 1--1 


(s,7) 的 像素 g 的 通路 (或 曲线 ) 是 特定 的 像素 on EET a 
序列 ， 其 坐标 为 Te 
(Xo Vo ds (Xs ido r s Kas Vad 1 0. i O24. 2 O11 0 1 
ON 0 0 11°00 01 0 
FLA Ca r = (4, Y) (Xp Yn) = (850) 5 ARE 0 OND, 0 1 1)1 0 01 0 
(xi yi) A (44,94) TF 1 <i 入 由 是 邻接 的 。 Se. teers —~ 
9 06 0°0 oo 0 e 


在 这 种 情况 下 ，n 是 通路 的 长 度 。 如 果 


(Xo yo) = (Xn Vn) ， 则 通路 是 闭合 通路 。 可 以 
依据 特定 的 邻接 类 型 定义 4 邻接 、8 邻接 或 m 
邻接 。 例 如 ， 如 图 2.25(b) 所 示 ， 右 上 点 和 右 
下 点 之 间 的 通路 是 8 通路 ， 而 图 2.25 (c) 中 的 


(a) 像 素 的 排列 ;(b) 8 邻接 像素 (邻接 性 由 虚线 所 
示 ， 注 意 二 义 性 ) ; (c) m 邻接 ; (d) 采 用 8 邻接 时 ， 
两 个 值 为 1 的 区 域 是 邻接 的 ; (e) 如 果 在 区 域 和 
背景 间 采 用 8 邻接 ， 则 加 圆圈 的 点 是 仅 赋 1 值 的 
像素 的 边界 点 的 一 部 分 ; (1 值 区 域 的 内 部 边界 不 


通路 是 m 通路 。 

令 S 是 图 像 中 的 一 个 像素 子 集 。 如 果 S 
的 全 部 像素 之 间 存 在 一 个 通路 ， 则 可 以 说 两 个 像素 p 和 g 在 5 中 是 连通 的 。 对 于 5 中 的 任何 像素 p,，S 
中 连通 到 该 像素 的 像素 集 称 为 S 的 连通 分 量 。 如 果 8$ 仅 有 一 个 连通 分 量 ， 则 集合 $ 称 为 连通 集 。 

邻 R 是 图 像 中 的 一 个 像素 子 集 。 如 果 R 是 连通 集 ， 则 称 R 为 一 个 区 域 。 两 个 区 域 ， 如 果 它 们 联合 
形成 一 个 连通 集 ， 则 区 域 R 和 RR, 称 为 邻接 区 域 。 不 邻接 的 区 域 称 为 不 连接 区 域 。 在 谈 到 区 域 时 ,我 
们 考虑 的 是 4 邻接 和 8 邻接 。 为 使 我 们 的 定义 有 意义 ， 必 须 指 定 邻 接 的 类 型 。 例 如 ， 如 果 仅 使 用 8 邻 
接 ， 则 图 2.25 (da) 中 的 两 个 区 域 (由 1 组 成 的 ) 是 邻接 的 (根据 前 一 段 的 定义 ， 两 个 区 域 之 间 不 存在 4 通 
路 ,它们 的 并 集 不 是 连通 集 ) 。 l 

假设 一 幅 图 像 包 含有 KARER, BIR, k=1,2,-°,K ， 且 它们 都 不 接触 图 像 的 边界 ”。 
A R 代表 所 有 KK 个 区 域 的 并 集 ， 并 日 令 (R,) 代表 其 补 集 (回忆 可 知 ,， 集合 S 的 补 集 是 不 在 S 中 的 点 
的 集合 ) 。 我 们 称 R, 中 的 所 有 点 为 图 像 的 前 景 ， 而 称 (R,)* 中 的 所 有 点 为 图 像 的 背景 。 

区 域 R 的 边界 (也 称 为 边缘 或 轮 廊 ) 是 这 样 的 点 集 ， 这 些 点 与 R 的 补 集中 的 点 邻近 。 换 一 种 方式 说 , 一 
个 区 域 的 边界 是 该 区 域 中 至 少 有 一 个 背景 邻 点 的 像素 集 。 这 里 再 强调 一 下 ， 我 们 必须 指定 用 于 定义 邻接 的 
连通 性 。 例 如 ， 图 2.25 (e) 中 被 圈 出 的 点 如 果 在 区 域 及 其 背景 间 使 用 4 连通， 就 不 是 1 值 区 域 边界 的 成 员 。 
。 基于 这 一 规则 ， 为 处 理 这 种 情况 ， 一 个 区 域 及 其 背景 中 的 点 之 间 的 邻接 要 根据 8 连通 来 定义 。 


形成 闭合 通路 ,但 其 外 部 边界 可 以 形成 闭合 通路 


D 进行 这 种 假设 的 目的 在 于 避免 处 理 特殊 情形 。 这 样 做 不 会 丧失 一 般 性 ， 因 为 如 果 一 个 或 多 个 区 域 接触 到 图 像 的 边界 ， 我 们 可 简 
单 地 使 用 ! 像素 宽 的 背景 值 边 界 来 填充 图 像 。 
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前 述 定 义 有 时 称 为 区 域 的 内 边界 ， 以 便 与 其 外 边界 相 区 分 ， 外 边界 对 应 于 背景 边界 。 在 开发 追踪 
边界 的 算法 时 这 一 区 别 很 重要 。 这 种 算法 为 了 保证 结果 形成 一 个 闭合 通路 ,通常 是 沿 外 边界 确立 的 。 . 
例如 ， 在 图 2.25 (台中 ，1 值 区 域 的 内 边界 是 该 区 域 本 身 。 这 一 边界 并 不 满足 先前 给 出 的 闭合 通路 的 定 
义 。 男 一 方面 ， 区 域 的 外 边界 确实 形成 了 一 个 围绕 该 区 域 的 闭合 通路 。 

如 果 尺 恰巧 是 整 幅 图 像 (假设 这 幅 图 像 是 像素 的 方形 集合 ) ， 则 边界 由 图 像 第 一 行 、 第 一 列 和 最 后 
一 行 、 最 后 一 列 的 像素 集合 来 定义 。 这 个 附加 定义 是 需要 的 ， 因 为 一 幅 图 像 超 过 边界 范围 之 外 没有 邻 
点 。 正 常情 况 下 ， 当 我 们 提 到 一 个 区 域 时 ， 指 的 是 一 幅 图 像 的 子 集 ， 并 且 区 域 边界 中 任何 与 图 像 边缘 
吻合 的 像素 都 作为 区 域 边界 的 一 部 分 全 部 包含 于 其 中 。 

边缘 的 概念 在 涉及 区 域 和 边界 的 讨论 中 常常 遇 到 。 然 而 ， 这 些 概 念 之 间 有 一 个 关键 区 别 。 一 个 有 
限 区 域 的 边界 形成 一 条 闭合 通路 ,并且 是 “整体 ”概念 。 正 如 第 10 章 详细 讨论 的 那样 ,边缘 由 具有 某 
些 超过 预先 设 定 的 阔 值 的 导数 值 的 像素 形成 。 这 样 ， 边 缘 的 概念 就 是 基于 在 进行 灰 度 级 度量 时 不 连续 
点 的 “局 部 ”概念 。 把 边缘 点 连接 成 边缘 线段 是 可 能 的 ， 并且 有 时 以 与 边界 对 应 的 方法 连接 线段 ,但 
并 不 总 是 这 样 。 边缘 和 边界 吻合 的 一 个 例外 是 二 值 图 像 的 情况 。 根据 连通 类 型 和 所 用 的 边缘 算 子 (在 第 
10 章 中 讨论 ) ， 从 二 值 区 域 提取 边缘 与 区 域 边界 是 一 样 的 ,这 很 直观 。 第 10 章 中 我 们 会 看 到 ， 概念 上 
边缘 考虑 为 灰 度 不 连续 ， 把 边界 考虑 为 闭合 通路 是 有 帮助 的 。 


2.5.3 ”距离 度量 
对 于 坐标 分 别 为 (x, y), (s, 2) 和 (v,w) 的 像素 p,q 和 z， 如 果 


(a) D(p,q) 20 [ D(p, gq)=0 , BEA p=q] 
(b) D(p,q) = D(q, p) B. 
(c) D(p, z) < D(p, q)+ D(q, z) o 


则 思 是 距离 函数 或 度量 。p 和 9 间 的 欧 几 里 得 ( 欧 氏 ) 距 离 定义 如 下 : 


D,(p.q)= [@-s} +- F (2.5-1) 
对 于 距离 度量 ， 距 点 (x, y) 的 距离 小 于 等 于 某 个 值 的 像素 ， 是 中 心 在 (x,y») EFEN r 的 圆 平面 。 
p 和 g 间 的 距离 D, (又 称 为 城市 街区 距离 ) 由 下 式 定义 : 
D,(p, q4) =|x-s|+|y -1| (2.5-2) 
在 这 种 情况 下 , EE (x, y) 的 距离 D, 小 于 等 于 某 个 值 + 的 像素 形成 一 个 中 心 在 (x,y) 的 菱形 。 例如 , 距 中 


DA (x, y) 的 距离 D 小 于 等 于 2 的 像素 ， 形 成 固定 距离 的 下 列 轮廓 ; 
2 


N 
NF DD 
=. OF 
Nhe N 

N 


N 


其 中 D, =1 的 像素 是 (x,y) 的 4 邻 域 。 
p Allg 间 的 DD 距离 (又 称 为 棋盘 距离 ) 由 下 式 定 义 : 
Ds (p, q) = max(|x—s|,| y-t) (2.5-3) 
ha 在 这 种 情况 下 , HE (x, y) 的 D, 距离 小 于 等 于 某 个 值 + 的 像素 形成 中 心 在 (x,y) 的 方形 。 例 如 , 距 中 心 点 
93| (x,y) ÉI D; 距离 小 于 等 于 2 的 像素 形成 下 列 固定 距离 的 轮廓 : 





章 ”数字 图 像 基础 41 


和 2 
2 
2 
2 
2 
2 


Nr FP eb 
mi B 
NF Ree 
NNN N WY 


其 中 D = 1 的 像素 是 (x, y) 的 8 邻 域 。 

TER, p 和 4 之 间 的 D, ERA D 距离 与 任何 通路 无 关 ， 通 路 可 能 存在 于 各 点 之 间 ， 因 为 这 些 距 
离 仅 与 该 点 的 坐标 有 关 。 然 而 ， 如 果 选 择 考 虑 m 邻接 ， 则 两 点 间 的 D, 距离 用 点 间 的 最 短 通路 定义 。 
在 这 种 情况 下， 两 个 像素 间 的 距离 将 依赖 于 沿 通 路 的 像素 值 及 其 邻 点 值 。 例 如 ， 考 虑 如 下 排列 的 像素 
并 假设 p, p 和 ps 的 值 为 1，p, 和 p, 的 值 为 0 或 1: 


P3 P4 
Pi P2 
i P 
假设 我 们 考虑 值 为 1 的 像素 邻接 [ 即 V= {1} ]. WER pl 和 ps 是 0, 则 p 和 ps 间 的 最 短 m 通 路 的 长 度 (D, 
距离 ) 是 2。 如 果 p 是 1, 则 p, 和 pp 将 不 再 是 m 邻接 的 ( 见 m 邻接 的 定义 ), 并 且 最 短 m 通路 的 长 度 变 为 
3 (通路 通过 点 p pi pa p4)。 类 似 地 ， 如 果 p; 是 1( 目 pi 是 0)， 此 时 最 短 的 m 通 路 距离 也 是 3。 最后， 
WER p A p ABA 1, W p All ps 间 的 最 短 m 通 路 的 长 度 为 4， 此 时 通路 通过 点 p pi Po P P4o 


26 ”数字 图 像 处 理 中 所 用 数学 工具 的 介绍 


本 节 有 两 个 主要 目的 : 〈1D) 介绍 本 书 中 所 用 的 各 种 数学 工具 ; (2) 通 过 把 它们 用 于 各 种 基本 图 像 处 
理 任务 中 ,帮助 读者 找到 如 何 使 用 这 些 工 具 的 “感觉 "。 后 续 讨论 中 会 多 次 使 用 其 中 的 一 些 工 具 。 在 后 
面 的 章节 中 ， 我 们 将 根据 需要 来 扩展 这 些 工 具 的 范围 及 应 用 。 


中 三 ete, 建议 读者 从 水 
2.6.1 阵列 与 矩阵 操作 书 网 站 上 的 Tutorials 部 分 下 载 并 学 习 


CARRERE REENERT. AETR |A AE EN 
们 曾 提 到 ， 图 像 可 以 等 效 地 视 为 矩阵 。 事 实 上 ， 在 很 多 情况 下 ， 图 像 | pp 
间 的 操作 是 用 矩阵 理论 执行 的 ( 见 2.6.6 节 ) 。 基 于 这 个 原因 ， 我 们 必须 


了 解 阵列 与 矩阵 操作 之 间 的 区 别 。 例 如 ， 考 虑 下 面 的 2x2 ENR: 


ki a e A 
021 an by, by. 
这 两 幅 图 像 的 阵列 相 乘 是 
fa alf A kpi sa 
az an || bry by azb anbn 
另 一 方面 ， 和 矩阵 相 乘 由 下 式 给 出 
a mlb eles + arb, a biz eet, 
az an || bz by. db + anb azb + anb 
我 人 ] 假 设 阵 列 操作 贯穿 全 书 ， 除 非 另 做 说 明 。 例 如 ， 当 我 们 谈 到 一 幅 图 像 的 求索 时 ， 意 味 着 每 个 像素 均 进 
行 求 晨 操作 ， 当 我 们 谈 到 一 幅 图 像 除 以 另 一 幅 图 像 时 ， 意 味 着 在 相应 的 像素 对 之 间 进 行 相 除 ， 等 等 。 | 时 


~ 
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2.6.2 ”线性 操作 与 非 线性 操作 


图 像 处 理 方法 最 重要 的 分 类 依据 之 一 是 ， 它 是 线性 的 还 是 非 线性 的 。 考 虑 一 般 的 算 子 H, HAT 
对 于 给 定 的 输入 图 像 f(x,y) ， 产 生 一 幅 输 出 图 像 g(x, y) : 
H[f(x, »)]|= g(x, y) (2.6-1) 
如 果 
H[af(xy)+aF,%y») ]=aH[fn]+a,A[ f(x,»)|= ag Eya gy) (26-2) 
则 称 五 是 一 个 线性 算 子 ， Hh aa, f(x,y) Af; (x,y) NEE BOR KRIE) 。 式 (2.6-2) 
指出 输出 是 线性 操作 ， 因 为 两 个 输入 的 和 , 与 分 别 对 输入 进行 操作 然后 再 求 和 得 到 的 结果 相同 。 另外， 
输入 乘 以 常数 的 线性 操作 的 输出 ， 与 乘 以 该 常数 的 原始 输入 的 操作 的 输出 是 相同 的 。 第 一 个 特性 称 为 
加 性 ， 第 二 个 特性 称 为 同 质 性 。 
作为 一 个 简单 的 例子 ,假设 瓦 是 求 和 算 子 2 ， 即 该 算 子 的 功能 是 对 输入 简单 地 求 和 : 为 检验 其 线 
性 ， 我 们 从 式 (2.6-2) 的 左 侧 开始 ， 并 试图 证 明 它 与 右 侧 相等 : 


Zaft eh] 2 ahed+ a) 这 些 是 阵列 求 和 而 不 是 图 像 的 所 
=4, >) fie y)+a, y) 有 元 素 的 求 和 。 因 此 ， 单 本 图 像 的 求 


和 是 该 图 像 本 身 。 





= a,g,(x,y)+ ag (x, y) 
其 中 第 一 步 遵循 求 和 是 分 布 式 的 这 样 一 个 事实 。 因 此 ， 左 边 的 展开 等 于 式 (2.6-2) 的 右边 ， 从 而 我 们 得 
出 该 求 和 算 子 是 线性 的 这 一 结论 。 
另 一 方面 ， 考 虑 最 大 值 操作 ， 其 功能 是 在 图 像 中 寻找 像素 的 最 大 值 。 针 对 这 一 目的 ,证 明 该 操作 
是 非 线性 的 最 简单 方法 是 ， 寻 找 一 个 测试 式 (2.6-2) 时 失败 的 例子 。 考 虑 下 列 两 幅 图 像 : 


nfo- 2 fe 5s 
s-[) sanli ;| 


HERS a =1 和 a, = -1。 为 了 对 线性 进行 测试 ， 我 们 再 次 从 式 (2.6-2) 的 左 侧 开始 : 


mo Jolt JE 2) 


下 一 步 ,做 右边 ， 我 们 得 到 


1 k i 1 6 2 =3 1)7 = —4 
(1) max 9 3 +(—1)max 4 alt= +(-l)7= 


此 时 ， 式 (2.6-2) 的 左边 和 右边 并 不 相等 ， 因 此 我 们 证 明了 通常 求 最 大 值 的 操作 是 非 线 性 的 。 

如 后 面 三 章 所 示 ， 特 别 是 第 4 章 和 第 5 章 ， 线 性 操作 特别 重要 ， 因 为 它们 是 以 可 用 于 图 像 处 理 
的 大 量 理 论 和 实践 结果 为 基础 的 。 非 线性 系统 很 难 被 很 好 地 理解 ， 因 此 其 应 用 范围 受到 了 更 多 的 限 
制 。 但 在 后 面 几 章 中 ,我 们 会 碰 到 一 些 性 能 远 优 于 线性 操作 的 非 线性 图 像 处 理 操作 。 


2.6.3 ”算术 操作 


如 2.6.1 节 中 讨论 的 那样 ， 图 像 间 的 算术 操作 是 阵列 操作 ， 即 算术 操作 在 相应 的 像素 对 之 问 执行。 
到 4 种 算术 操作 表示 为 





第 2 章 数字 图 像 基础 


s(x, y) = f(x, y)+ g(x, y) 
d(x, y) = f(x, y)—g(% y) 
P(x, y) = f(x, y)x g(x, y) 
v(x, y) = f(x, y)+ g(x, y) 
它 可 理解 为 是 在 f 和 g 中 相应 的 像素 对 之 间 执 行 操作 ,其 中 x=0,1,2,…,M 1, y=0,1, 2,- 
通常 M 和 是 图 像 的 行 和 列 。 很 明显 ， s,d, p Fil pee ae 的 图 像 。 注意 ， 按照 刚才 定义 的 方 


O 回忆 可 知 ,均值 为 m 的 随机 变量 z 的 方差 定义 为 E[(z -m)*] ， 其 中 EL} 是 该 参量 的 期 望 值 。 两 个 随机 变量 z 和 2, 的 协 方差 定 
义 为 E[(z; 一 m,)(zj -mj)] 。 如 果 变量 是 不 相关 的 ， 则 它们 的 协 方差 为 零 。 
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像 平 均 的 结果 。 我 们 看 到 ， 图 2.26(e) ， 即 由 天 = 50 得 到 的 结果 已 经 相当 清晰 。 图 2.260 的 图 像 是 由 100 幅 
带 噪 图 像 平均 得 到 的 结果 ， 与 图 2.26 (e) 比较 仅 稍 有 改进 。 

相 加 是 连续 积分 的 离散 形式 。 在 天 文 观测 中 , 一 种 与 刚刚 描述 的 方法 等 同 的 处 理 是 使 用 CCD ( 见 2.3.3 
W 或 类 似 传感器 的 累积 能 力 ， 通 过 长 时 间 地 观察 同 三 场景 来 达到 降 噪 的 目的 。 冷 却 也 常常 用 于 降低 传 感 
器 噪声 。 然 而 ， 最 终结 果 类 似 于 对 一 组 噪声 数字 图 像 进行 平均 操作 。 


abe 
def 


图 2.26 (a) 被 加 性 高 斯 噪声 污染 的 星系 对 NGC 3314 图 像 ;(b)~( 介 分 别 是 
对 5, 10, 20, 50, 100 幅 噪声 图 像 平 均 的 结果 ( 原 图 像 由 NASA 提供 ) 





例 2.6 增强 差别 的 图 像 相 减 。 

图 像 相 减 经 常用 于 增强 图 像 之 间 的 差别 。 例 如 ， 图 2.27 (>) 中 的 图 像 是 通过 把 图 2.27(a) 中 的 每 个 像素 
的 最 低 有 效 比特 置 0 得 到 的 。 在 视觉 上 , 这些 图 像 都 不 可 辨别 。 然 而 ， 如 图 2.27(c) 所 示 ， 从 一 幅 图 像 减 去 
另 一 幅 图 像 ， 则 清楚 地 显示 了 它们 的 差别 。 在 差 值 图 像 中 ， 黑 (0) 值 指出 了 在 该 位 置 图 2.27(al 和 图 2.27(b) 
之 间 没 有 差别 。 

作为 男 一 个 例子 , 我 们 简单 地 讨论 称 之 为 模板 模式 放射 成 像 的 医学 成 像 领 域 , 这 是 图 像 相 减 在 商业 上 
成 功 且 高 受益 的 应 用 。 考 虑 如 下 形式 的 图 像 差 ; 

g(x, y) = f(x, y)— A(x, y) (2.6-9) 
在 这 种 情况 下 , 模板 h(x, y) 是 病人 身体 一 个 区 域 的 和 射线 图 像 , 该 图 像 
由 放 在 X 射线 源 对 面 的 电视 摄像 机 (代替 传统 的 X 射线 胶片) SO, at l aa ERNSTA 
程 由 以 下 几 步 组 成 : 将 一 种 又 射线 造影 剂 注入 病人 的 血 流 ,摄取 一 系列 | 
与 h(x, y) 解 剖 区 域 相同 的 活体 图 像 [ 它们 的 样品 表示 为 f(x, y) ] ， 从 一 系列 注射 过 造影 剂 的 活体 图 像 
中 减 去 模板 h(x, y) 。 从 每 幅 活体 图 像 中 减 去 模板 的 最 终结 果 是 这 样 的 区 域 , 即 出 现在 输出 图 像 g(x, y) 
中 用 以 区 分 f(x, y) Al A(x, vy) 之 间 差别 的 区 域 ， 目 的 是 增强 细节 。 因 为 图 像 可 以 按 电视 速率 获取 ， 这 
一 过 程 基 本 上 给 出 了 一 段 显示 造影 剂 怎样 在 被 观察 区 域 通过 动脉 传播 的 影片 。 

图 2.28 (a) 显示 了 在 砚 介质 注射 到 血 流 中 前 ， 病 人 头 部 上 方 的 一 幅 模板 的 XX 射线 图 像 ， 图 2.28 (b) ETE 
注射 础 介质 后 得 到 的 一 幅 活 体 图 像 。 图 2.28 (c) 是 图 2.8 (a) 与 图 2.8 b) 的 差 。 在 这 幅 图 像 中 ， 一 些 较 细 的 血 
管 结构 清晰 可 见 。 图 2.28 (qd) 的 差别 很 清楚 ， 它 是 由 (ce) 增强 了 对 比 度 后 得 到 的 (下 一 章 中 将 讨论 对 比 度 增 
强 )。 图 2.28 (d) 是 介质 在 大 脑 内 通过 血管 传播 的 一 幅 清 晰 “图 形 ”。 









通过 图 像 相 减 来 更 改 检测 也 用 于 图 
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es i 3 i Bee, i a bic 
图 2.27 ” (a) 华盛顿 特区 的 红外 图 像 ;(b) 将 图 像 (a) 中 的 每 个 最 低 阶 比特 置 0 得 
到 的 图 像 ;(c) 两 幅 图 像 的 差 ， 为 清楚 起 见 ， 图 像 已 标定 到 区 间 [0, 255] 
abad TE 7” ba) eee at 





图 2.28 Res wR TER: (a) 模板 图 像 ，(b) APR; (c) 图 (a) 和 图 (b) 的 差 值 图 像 ; 
(d) 增强 后 的 差 值 图 像 [图 (a) 和 图 (b) 由 荷兰 Utrecht 大 学 图 像 科学 研究 所 医学 中 心 提供 ] 


例 2.7 使 用 图 像 相 乘 和 相 除 来 校正 阴影 。 。 
图 像 相 乘 (或 相 除 ) 的 一 种 重要 应 用 是 阴影 校正 。 仿 没 一 个 成 像 传感器 产生 可 由 f (x,y) 表示 的 完美 图 
像 与 阴影 函数 h(x, y) 的 乘积 来 建 模 的 图 像 ， 即 g(x, y)= (x, y)h(x, y) o MER AG, y) BA, 那么 我 们 可 以 


使 用 h(x; y) 的 反 函 数 [ 即 g(x, y)/ h(x, y) ] 乘 以 感知 图 像 的 方法 得 到 S(x, y) 。 如 果 h(x, y) 未 知 ， 但 图 像 





系统 可 以 访问 ， 我 们 可 以 Hi j 具 有 恒定 灰 度 的 目标 成 像 得 到 一 个 近似 的 阴影 函数 。 FERRATA, 我 
们 常常 如 9.6 节 讨论 的 那样 直接 从 图 像 估计 阴影 模式 。 图 2.29 显示 了 阴影 校正 的 一 个 例子 。 
图 像 相 乘 的 另 一 种 普通 应 用 是 模板 操作 ， 也 称 为 感 兴趣 区 域 (ROD 操作 。 m2 s0m E 
模板 图 像 与 一 幅 给 定 的 图 像 相 乘 ， 模 板 图 像 的 ROI 区 域 为 1， 其 他 区 域 为 0。 模 板 图 像 中 的 ROI 可 能 不 止 
一 个 ， 虽然 由 于 实现 容易 而 常常 使 用 和 矩形 形状 ,但 ROL 的 形状 可 以 是 任意 的 。 








图 2.29 阴影 校正 : (a) 钨 丝 及 其 支撑 物 的 阴影 SEM UR, RIT 130 倍 ; (b) 阴影 模式 ，(c) 图 (b) 
的 倒数 与 图 (a) 相 乘 的 结果 ( 原 图 像 由 俄勒冈 尤 金 大 学 地 质 科 学 系 的 Michael Shaffer 提供 ) 


在 结束 这 一 节 的 讨论 之 前 ， 对 图 像 算 术 操作 的 实现 做 些 评述 是 有 益 的 。 实 际 上 ， 大 多 数 图 像 使 
用 8 比特 显示 (即使 24 比特 的 彩色 图 像 也 是 由 分 立 的 三 个 8 比特 通道 组 成 的 ) 。 这 样 , 我 们 认为 图 像 
的 灰 度 值 范围 为 0 ~255。 当 图 像 以 标准 格式 存储 时 ， 如 TIFF 或 PEG， 图 像 的 灰 度 值 将 自动 转换 到 
该 范围 。 然 而 ， 转 换 所 用 的 方法 取决 于 所 用 的 系统 。 例 如 ， 两 幅 8 比特 图 像 的 不 同 取 值 范围 可 以 是 从 
最 小 的 -255 到 最 大 的 +255， 图 像 之 和 的 值 可 能 在 范围 0 到 510 内 。 许多 软件 包 在 把 图 像 转换 为 8 比特 
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图 像 时 ， 仅 简单 地 把 所 有 的 负 值 转换 为 0， 而 把 超过 255 的 值 转换 为 2355。 给 定 一 幅 图 像 保证 图 像 
间 算 术 操作 的 整个 值 域 落 入 某 个 固定 比特 数 的 方法 如 下 。 首 先 ,我 们 执行 操作 
Son = f -min(f) (2.6-10) 





图 2.30 (a) 牙齿 的 射线 数字 图 像 ，(b) 使 用 填充 物 隔离 牙齿 的 ROI 模 
板 ( 白 色 对 应 于 1， 黑 色 对 应 于 0) ; (c) 图 (a) 和 图 \b) 相 乘 的 结果 


该 操作 生成 最 小 值 为 0 的 一 幅 图 像 。 然 后 ， 执 行 操作 

f,=K|f,,/max(f,,)| (2.6-11) 
该 操作 生成 一 幅 标定 的 图 像  ， 其 值 在 [0, 范围 内 。 在 处 理 8 比特 图 像 时 ， 置 及 =255， 我 们 得 到 
幅 灰 度 范围 从 0 到 255 的 8 比特 满 标 度 图 像 。 类 似 的 方法 可 用 于 16 比特 或 更 高 比特 的 图 像 。 这 种 方法 


可 用 于 所 有 的 算术 操作 。 在 执行 除法 操作 时 ， 我 们 还 有 额外 的 要 求 ， 即 需要 将 一 个 较 小 的 数 加 到 除数 
图 像 的 像素 上 ， 以 避免 除 以 0 的 情况 。 


2.6.4 ”集合 和 逻辑 操作 

本 节 简 单 介绍 一 些 重要 的 集合 和 逻辑 操作 ， 以 及 模糊 集合 的 概念 。 

基本 集合 操作 

令 4 为 一 个 实数 序 对 组 成 的 集合 。 如 果 a= (ai,a,) 是 4 的 一 个 元 素 ， 则 将 其 写成 


acA (2.6-12) 
同样 ， 如 果 a 不 是 4 的 一 个 元 素 ， 则 写成 
a¢A (2.6-13) 

不 包含 任何 元 素 的 集合 称 为 空 集 ， 用 符号 名 表示 。 

集合 由 两 个 大 括号 中 的 内 容 表示 , BY}. 例如 , 当 我 们 将 一 个 表达 式 写 成 C={fwlw=-d,d € D} 的 
形式 时 ， 所 表达 的 意思 是 : 集合 C 是 元 素 w 的 集合 ， 而 w 是 通过 用 -1 与 集合 D 中 的 所 有 元 素 相 乘 得 
到 的 。 该 集合 用 于 图 像 处 理 的 一 种 方法 是 , 令 集 合 的 元 素 为 图 像 中 表示 区 域 (物体 ) 的 像素 的 坐标 (整数 
序 对 ) 。 

MRES 4 中 的 每 个 元 素 又 是 男 一 个 集合 B 中 的 一 个 元 素 ， 则 称 4 为 B 的 子 集 ， 表 示 为 


AcB (2.6-14) 
两 个 集合 4 和 B 的 并 集 表示 为 

C=AUB (2.6-15) 
这 个 集合 包含 集合 4 和 B 中 的 所 有 元 素 。 类 似 地 ， 两 个 集合 4 和 B 的 交集 表示 为 

D=ANB (2.6-16) 


Bee 含 的 元 素 同时 属于 集合 4 和 B。 如 果 A 和 B 两 个 集合 没有 共同 的 元 素 , 则 称 这 两 个 集合 是 
a) 不 相 容 的 或 互 斥 的 。 此 时 ， 
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AN B= (2.6-17) 
全 集 U 是 给 定 应 用 中 的 所 有 元 素 的 集合 。 根据 这 一 定义 , 给 定 应 用 的 所 有 集合 元 素 是 对 于 该 应 用 
定义 的 全 部 成 员 。 例 如 ， 如 果 处 理 实数 集合 ， 则 集合 的 全 集 是 实数 域 ， 它 包 含 所 有 的 实数 。 在 图 像 处 
理 中 ,我 们 一 般 将 全 集 定义 为 包含 图 像 中 所 有 像素 的 正方 形 。 
集合 4 的 补 集 是 不 包含 于 集合 4 的 元 素 所 组 成 的 集合 ， 表 示 为 


A ={w we A} (2.6-18) 
集合 4 和 8B 的 差 表示 为 4-8 ， 定 义 为 
A-B={w|we A,we B} = ANMB° (2.6-19) 


可 以 看 出 , 这 个 集合 中 的 元 素 属于 4 而 不 属于 8 例如 ,我们 可 以 根据 并 做 集合 的 差 操 作 来 定义 A ， 
即 4 =U-4。 

图 2.31 说 明了 前 述 概念 , 全集 是 包含 在 所 示 正 方形 中 的 坐标 的 集合 ,， IF ARS A 和 B 是 包含 在 所 
示 边 界 内 的 坐标 的 集合 。 在 每 一 幅 图 中 ， 集 合 操作 的 结果 用 灰色 显示 。 

在 前 面 的 讨论 中 ， 集 合成 员 是 以 位 置 (坐标 ) 为 基础 的 。 处 理 图 像 时 ， 一 个 隐 含 的 假设 是 ， 集 合 内 
所 有 像素 的 灰 度 相同 , 因为 我 们 还 没有 定义 关于 灰 度 值 的 集合 操作 ( 即 我 们 还 未 指定 两 个 集合 的 交集 中 
的 灰 度 是 什么 ) 。 图 2.31 所 示 操 作 的 唯一 方法 可 以 这 样 确定 ， 如 果 包 含 这 两 个 集合 的 图 像 是 二 值 的 , 在 
这 种 情况 下 ， 我 们 可 以 说 集合 成 员 是 基于 坐标 的 ， 并 假设 这 两 个 集合 的 所 有 成 员 具 有 相同 的 灰 度 。 我 
们 将 在 下 一 节 做 更 详细 的 讨论 。 


abcde 


图 2.31 (8) 二 维 空 间 中 的 两 个 坐标 集合 4 和 B; (b)A MB Per (c) A Fil B 的 交集 ; 
(dA 的 补 集 ; (e) A FB W, 在 (b) 到 (e) 中 ， 阴 影 区 域 表 示 指 定 集合 操作 的 成 员 


在 处 理 灰 度 图 像 时 , 前 述 概念 不 再 适用 ; 因为 我 们 必须 指定 来 自 集合 操作 结果 的 所 有 像素 的 灰 度 。 
事实 上 , 正如 我 们 将 在 3.8 节 和 9.6 节 中 看 到 的 那样 , 灰 度 值 的 并 集 操作 和 交集 操作 通常 分 别 定义 为 相 
应 像素 对 的 最 大 和 最 小 ， 而 补 集 操作 定义 为 常数 与 图 像 中 每 个 像素 的 灰 度 间 的 两 两 之 差 。 我 们 处 理 相 
应 像素 对 的 事实 告诉 我 们 ， 灰 度 级 集合 操作 是 如 2.6.1 节 定义 的 阵列 操作 。 下 面 的 例子 是 涉及 灰 度 级 图 
i pia a Naa A di 








td 03 
D 式 (2.6-12) 至 式 (2.6-19) 中 的 操作 是 代数 集 的 基础 , 它 从 4UB=BU4 和 4nB=B8nd 这 样 的 交换 律 开始 ,形成 了 集合 操作 的 z 
广泛 理论 基础 。 尽 管 代数 集 的 处 理 超出 了 当前 讨论 的 范围 ， 但 读者 应 了 解 这 一 点 - 
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两 个 灰 度 集合 4 和 8B 的 并 集 可 定义 为 集合 
AUB= {max(a,b)lae A, be B} 


也 就 是 说 ， 两 个 灰 度 集合 (图 像 ) 的 并 集 是 一 个 由 空间 相应 元 素 对 间 的 最 大 灰 度 形成 的 阵列 。 注 意 坐 标 同样 
不 变 ， 因 此 A Al 的 并 集 是 大 小 与 这 两 幅 图 像 相同 的 图 像 。 正 如 说 明 的 那样 ， 假 设 4 仍 表示 图 2.32(a) 中 
的 图 像 ， 并 且 令 8 表示 与 4 大 小 相同 的 方形 阵列 , 但 其 中 所 有 的 z 值 等 于 A 中 元 素 的 平均 灰 度 m 的 3 倍 。 
图 2.32 (c) 显示 了 执行 这 种 并 集 操作 的 结果 ， 其 中 所 有 超过 3m 的 值 呈现 为 4 的 值 ， 而 所 有 其 他 像素 的 值 为 
3m， 即 中 间 灰 度 值 。 





图 2.32 灰 度 级 图 像 的 集合 操作 : (a) 原 图 像 ;(b) 使 用 补 集 操作 得 到 的 负 像 ; 
(c) 图 (a) 与 常数 图 像 的 并 集 ( 原 图 像 由 G. E. Medical Systems 公司 提供 ) 


逻辑 操作 y NOTA) 
在 处 理 二 值 图 像 时 ， 我 们 可 以 把 图 像 想象 为 属国 


像素 集合 的 前 景 (1 值 ) 与 背景 (0 值 ) o 然后 ， 如 果 (A) AND (B) 
我 们 将 区 域 ( 目 标 ) 定义 为 由 前 景 像素 组 成 ， 则 图 
2.31 中 说 明 的 集合 操作 就 变 成 了 二 值 图 像 中 目标 
坐标 间 的 操作 。 处 理 二 值 图 像 时 ，OR、AND 和 




























NOT 逻辑 操作 就 是 指 普通 的 并 、 交 和 求 补 操作 ， JIRE 
EP SPE — mk AERE, RRE, m m OR F 
1 代表 真 ，0 代表 假 。 

考虑 由 前 景 像素 组 成 的 区 域 (集合 )4 M B. TK (A) AND [NOT (B)] 


两 个 集合 的 OR (或 ) 操作 结果 不 是 属于 4， 就 是 属 
FB, 或 者 属于 两 者 。AND 操作 是 共同 属于 才 和 
B 的 元 素 的 集合 。 集合 4 的 NOT 操作 是 不 在 4 中 (A) XOR (B) 


的 元 素 的 集合 。 因 为 我 们 要 处 理 图 像 ， 如 果 4 是 
给 定 的 前 景 像素 的 集合 ， 那 么 NOT(4) 是 图 像 中 D 
ARTE A 中 的 所 有 像素 的 集合 ,这些 像素 是 背景 像 


素 ， 并 有 可 能 是 其 他 前 景 像素 。 我 们 可 以 将 该 操 ”图 2.33 涉及 前 景 (白色 ) 像 素 的 逻辑 操作 的 说 明 。 黑 
作 想象 为 : 把 4 中 的 所 有 像素 转换 为 0( 黑 色 ) , 色 代 表 一 进 制 数 0， 白 色 代表 一 进 制 数 1。 虚 
并 把 所 有 不 在 4 中 的 元 素 转换 为 1 (白色 ) 。 图 2.33 sg 
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说 明了 这 些 操作 。 注 意 ， 显 示 该 操作 结果 的 第 4 行 是 前 景 像素 集合 ， 它 属于 4 但 不 属于 B， 这 就 是 


式 (2.6-19) 中 集合 差 的 定义 。 图 中 的 最 后 一 行 是 XOR ( 异 或 ) 操作 的 结果 ， 该 结果 是 属于 4 或 好 的 前 
景 像素 的 集合 ， 但 不 是 两 者 的 前 景 像素 的 集合 。 可 以 说 ， 前 述 操作 是 区 域 间 的 操作 ， 很 明显 ， 区 域 可 
以 是 不 规则 的 和 大 小 不 同 的 。 这 与 前 面 讨论 的 灰 度 级 操作 了 矛盾， 前 面 的 灰 度 操作 是 阵列 操作 并 要 求 空 
间 维 数 相 同 。 也 就 是 说 ， 灰 度 集合 操作 涉及 整个 图 像 ， 而 不 是 图 像 的 区 域 。 

我 们 仅 在 实现 AND，OR Fil NOT 逻辑 算 子 时 需要 涉及 理论 知识 ， 因 为 这 三 个 算 子 是 功能 完备 的 。 
换 句 话说 ， 任 何其 他 逻辑 操作 都 可 以 仅 用 这 三 个 基本 函数 执行 ， 如 图 2.33 中 的 第 4 行 所 示 ， 这 里 我 们 
FA AND FI NOT 实现 了 差 集 操作 。 逻 辑 操作 广泛 用 于 图 像 形态 学 处 理 ， 这 是 第 9 章 的 主题 。 

模糊 集合 

前 述 的 集合 和 逻辑 结果 很 “干脆 ”， 在 这 种 意义 下 ， 元 素 要 么 是 要 么 不 是 集合 中 的 成 员 。 这 在 某 
些 应 用 中 会 受到 严重 限制 。 考 虑 一 个 简单 的 例子 。 假 如 我 们 希望 把 世界 上 的 所 有 人 分 为 年 轻 人 和 非 年 
轻 人 。 EA “FE EA, S URREA, 令 4 是 U 的 子 集 ,我 们 把 它 称 为 年 轻 人 集合 。 为 了 形 
成 集合 A, RANGE TREE BR, HRA WX U PMB cH OO WR 1 值 或 0 值 。 如 果 U 中 的 
元 素 赋值 为 1, 则 该 元 素 就 是 4 的 一 个 成 员 , 否则 就 不 是 4 的 一 个 成 员 。 因 为 我 们 是 在 处 理 二 值 逻 辑 ， 
隶属 度 函数 简单 地 定义 为 一 个 国 值 , 低 于 该 贱 值 的 人 考虑 为 年 轻 人 ,高 于 该 贱 值 的 人 考虑 为 非 年 轻 人 。 
假如 我 们 定义 任何 20 岁 或 更 年 轻 的 人 是 年 轻 人 。 我 们 马上 面临 的 困难 是 : 年 龄 为 20 岁 零 1 秒 的 人 将 不 是 
年 轻 人 集合 的 成 员 。 这 一 限制 出 现在 我 们 用 于 分 类 年 轻 人 年 龄 的 阔 值 上 。 什 么 是 我 们 意味 的 “年 轻 ” 
需要 更 多 的 灵活 性 , 即 需要 从 年 轻 到 非 年 轻 逐 步 过 渡 。 模糊 集合 理论 使 用 隶属 度 函 数 来 实现 这 种 概念 ， 
该 函数 在 数值 1 (定义 为 年 轻 ) 和 0 (定义 为 非 年 轻 ) 之 间 逐 步 过 渡 。 使 用 模糊 集合 , 我 们 可 以 声明 一 个 人 
的 年 轻 度 为 50% (年 轻 和 非 年 轻 过 渡 的 中 间 ) 。 换 句 话说 ， 年 龄 是 一 个 不 精确 的 概念 ， 而 模糊 逻辑 了 提 
供 处 理 这 种 概念 的 工具 。3.8 节 将 详细 探讨 模糊 集合 。 


2.6.5 空间 操作 

空间 操作 直接 在 给 定 图 像 的 像素 上 执行 。 我 们 把 空间 操作 分 为 三 大 类 : (1) 单 像素 操作 ; (2) 邻 域 
操作 ; (3) 几何 空间 变换 。 s=T(z) 

单 像素 操作 


我 们 对 数字 图 像 执行 的 最 简单 的 操作 是 , 以 灰 度 为 基 
础 改变 单个 像素 的 值 。 这 类 处 理 可 以 用 一 个 形 如 下 式 的 变 


换 函 数 了 来 描述 : z 
s=T(z) (2.6-20) 

sth, z 是 原 图 像 中 像素 的 灰 度 ，s 是 处 理 后 的 图 像 中 
相应 像素 的 (映射 ) 灰 度 。 例 如， 图 2.34 示 出 了 得 到 一 幅 g en 

8 比特 负 图 像 的 变换 , 图 2.32 (b) 中 的 图 像 是 利用 集合 操 ”图 2.34 用 于 得 到 8 比特 图 像 的 负 图 像 的 灰 
作 得 到 的 。 我 们 将 在 第 3 章 中 讨论 指定 灰 度 变换 功能 的 度 变换 函数 。 虚 线 箭头 显示 了 任意 
一 此 我 术 。 输入 灰 度 值 zo 到 对 应 输出 值 so 的 变换 

邻 域 操作 


令 5, 代 表 图 像 f 中 以 任意 一 点 (x,y) 为 中 心 的 一 个 邻 域 的 坐标 集 。 邻 域 处 理 在 输出 图 像 g 中 的 相同 
坐标 处 生成 一 个 相应 的 像素 ， 该 像素 的 值 由 输入 图 像 中 坐标 在 Sy 内 的 像素 经 指定 操作 决定 。 例 如 ， 
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假设 指定 的 操作 是 计算 在 大 小 为 mxn 、 中 心 在 (x, 的 矩形 邻 域 中 的 像素 的 平均 值 。 这 个 区 域 中 像素 的 
位 置 组 成 集合 S。 。 图 2.35 (a) 和 (b) 说 明了 这 一 过 程 。 我 们 可 以 用 公式 的 形式 将 这 一 操作 描述 为 


ads pi (2.6-21) 
gay) sa f(r,c) 
KP r A e 是 像素 的 行 和 列 坐 标 ， 这 些 坐 标 是 S, 中 的 成 员 。 图 像 g 是 这 样 得 到 的 : 改变 坐标 (x,y) ， 
以 便 邻 域 的 中 心 在 图 像 f 中 从 一 个 像素 到 另 一 个 像素 移动 ， 并 在 每 个 新 位 置 重复 邻 域 操作 。 例 如 ， 图 
2.35 (d) 中 的 图 像 是 用 大 小 为 41x41 的 邻 域 按 这 种 方式 创建 的 。 最 终结 果 是 在 原 图 像 中 执行 局 部 模糊 。 
例如 ， 这 种 类 型 的 处 理 可 消除 小 细节 ,并 在 图 像 中 相应 的 大 区 域 实 施 “ 斑 点 ”补偿 。 我 们 将 在 第 3 章 、 
第 5 章 和 本 书 的 其 他 几 处 地 方 讨论 邻 域 处 理 。 
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(xy) 


该 像素 的 值 是 Swy 中 
像素 的 平均 值 





图 像 8 
图 2.35 ”使 用 邻 域 处 理 的 局 部 平均 ，(a)~(b) 说 明了 矩形 邻 域 的 过 程 ;(c) 1.3.2 节 讨 论 过 的 大 动脉 
血管 造影 ，(d) 将 m=n=41 代 入 式 (2.6-21) 后 的 结果 。 图 像 大 小 为 790x686 像素 
几何 空间 变换 和 图 像 配 准 
几何 变换 改进 图 像 中 像素 间 的 空间 关系 。 这 些 变换 通常 称 为 橡皮 膜 变换 ， 因 为 它们 可 视 为 在 一 块 
橡皮 膜 上 印刷 一 幅 图 像 ， 然 后 根据 预定 的 一 组 规则 拉 伸 该 橡皮 膜 。 在 数字 图 像 处理 中 ， 几 何 变换 由 两 
个 基本 操作 组 成 : (1) 坐标 的 空间 变换 ; (2) 灰 度 内 搬 ， 即 对 空间 变换 后 的 像素 赋 灰 度 值 。 
坐标 变换 可 由 下 式 表示 : 
(x, y) =T{Q, w)} (2.6-22) 
SUP, (v, w) 是 原 图 像 中 像素 的 坐标 ，(x, y) 是 变换 后 图 像 中 像素 的 坐标 。 例 如 ， 变 换 (x, vy) =T{(v, w)} = 


(v/2, w/ 2) 在 两 个 方向 上 把 原 图 像 缩 小 一 半 。 最 常用 的 空间 坐标 变换 之 一 是 仿 射 变换 (Wolberg[1990]) , 


hy ho 0 
bl ty 0 
by ba l 
这 个 变换 可 根据 矩阵 7 中 元 素 所 选择 的 值 ， 对 一 组 坐标 点 做 尺度 、 旋 转 、 平 移 或 偏 移 。 表 2.2 说 明了 
用 于 实现 这 些 变换 的 矩阵 值 。 式 (2.6-23) 中 和 矩阵 表示 的 真实 作用 提供 了 把 一 系列 操作 连接 在 一 起 的 框 
架 。 例 如 ， 如 果 我 们 想 要 调整 一 幅 图 像 的 大 小 ， 对 其 旋转 ， 并 把 处 理 结果 移动 到 某 一 位 置 ， 那 么 可 以 
简单 地 构成 一 个 3x3 和 矩阵， 然后 乘 以 表 2.2 中 的 尺度 、 旋 转 和 平移 矩阵 。 

前 面 的 变换 把 一 幅 图 像 上 的 像素 重新 定位 到 一 个 新 位 置 。 为 了 完成 该 处 理 ， 我 们 还 必须 对 这 些 新 
位 置 赋 灰 度 值 。 该 任务 可 用 灰 度 内 插 的 方法 完成 。 灰 度 内 插 这 一 主题 已 在 2.4.4 节 讨 论 过 。 在 那 一 节 开 
始 ， 我 们 用 一 个 放大 图 像 的 例子 讨论 了 给 新 像素 位 置 赋 灰 度 值 的 问题 。 正 像 表 2.2 中 第 二 行 详细 表 


[x y l]=[v w 1T=[y w 1] (2.6-23) 
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述 的 那样 ， 放 大 是 简单 的 尺度 变换 ， 且 其 分 析 类 似 于 我 们 对 图 像 放 大 那样 ， 可 用 于 从 表 2.2 中 的 其 他 


变换 得 到 的 对 重 定位 像素 赋 灰 度 值 的 问题 。 如 2.44 节 那 样 ， 在 做 这 些 变换 时 ， 我 们 可 考虑 最 近邻 、 双 
线性 和 双 三 次 内 插 技 术 。 


表 2.2 基于 式 (2.6-23) 的 仿 射 变换 


变换 名 称 HIERT 坐标 公式 例子 
1 0 0 T j 
恒 等 变换 0 100 
001 
x 
c, He @ Leu 
尺度 变换 gate 了 
001 tae 
CON AE x=vcosĝ-— wsing 
旋转 变换 -sing cos@ 0 
> re y=vsin@+weosé 
l X 9 x=v+t 
平移 变换 ONT 46 | 
es ee" adil 
id 
100 am 
(ERD REEM s, 1 0 in 
001 “ag 


1 s, 0 gay 
(水 平 ) 偏 移 变 换 Deke? Jensa 


实际 上 ， 我 们 可 以 按 两 种 基本 方法 来 使 用 式 (2.6-23) 。 第 一 种 方法 称 为 前 向 映射 ， 它 由 扫描 输入 
图 像 的 像素 ， 并 在 每 个 位 置 (ww) 用 式 (2.6-23) 直接 计算 输出 图 像 中 相应 像素 的 空间 位 置 (x, y) 组 成 。 
前 向 映射 算法 的 一 个 问题 是 , 输入 图 像 中 的 两 个 或 多 个 像素 可 被 变换 到 输出 图 像 中 的 同一 位 置 ， 这 就 
产生 了 如 何 把 多 个 输出 值 合并 到 一 个 输出 像素 的 问题 。 另 外 ,一 种 可 能 是 某 些 输出 位 置 可 能 完全 没有 
要 赋值 的 像素 。 第 二 种 方法 ， 称 为 反 向 映射 ， 扫 描 输 出 像素 的 位 置 ,并 在 每 个 位 置 (x, y) 使 用 
=T (x, 7 计算 输入 图 像 中 的 相应 位 置 。 然 后 ， 内 捅 (使 用 2.44 节 讨 论 的 技术 之 一 ) 使 用 最 近 的 
输入 像素 之 一 决定 输出 像素 的 灰 度 值 。 对 于 实现 来 说 ， 反 向 映射 比 前 向 映射 更 有 效 ， 因 而 被 许多 空间 
变换 的 商业 实现 所 采用 (如 MATLAB 就 采用 该 方法 ) 。 









了 一 Hf 300 ai OR, FA 2.36 (b)~(@) Æ 

于 的 结果 。 旋 转 是 在 保持 直线 特性 方面 

内 插 产 生 了 最 大 的 锅 具 边缘 ， 如 2.4.4 节 那 样 ， 
内 插 产 生 了 稍微 清晰 一 些 的 结果 。 事实 上 ， 
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如 果 比 较 图 2.36(c) 和 图 2.36(d) 中 放大 了 的 细节 ， 就 会 在 子 图 像 的 中 间 注 意 到 由 亮 到 暗 变换 引入 的 大 量 垂 
直 灰 度 块 ， 而 图 2.36(c) 中 的 垂直 灰 度 块 数量 要 比 图 2.36(d) 中 的 相应 垂直 灰 度 块 数量 多 ， 这 说 明 
字母 的 边缘 更 清晰 。 类 似 的 结果 可 用 表 2.2 中 的 其 他 空间 变换 ， 按 要 求 的 内 插 得 到 ( 恒 等 变 换 不 会 得 到 类 
似 的 结果 ， 增 量 为 整数 个 像素 的 平移 变换 也 不 会 得 到 类 似 的 结果 ) 。 这 个 例子 是 使 用 前 一 段 讨 论 的 反 向 映 
射 方法 实现 的 。 


TZEE abcd 


12.36 (a) 字 母 T 的 300dpi 图 像 ; (b) 旋 转 21? 并 用 最 近邻 内 插 给 经 空间 变换 后 的 像素 
赋 灰 度 值 后 的 图 像 ; (ce) 旋转 21° 并 用 双 线 性 内 插 赋 灰 度 值 后 的 图 像 ; (d) 旋转 
21° 并 用 双 三 次 内 搬 赋 灰 度 值 后 的 图 像 。 放 大 部 分 显示 了 三 种 内 插 方 法 的 边缘 细节 


图 像 配 准 是 数字 图 像 处 理 的 一 种 重要 应 用 , 用 于 对 齐 两 幅 或 多 幅 相 同 场景 的 图 像 。 在 前 述 讨 论 中 ， 
我 们 已 知 为 达到 和 希望 的 几何 变换 的 变换 函数 形式 。 在 图 像 配 准 中 , 我 们 有 可 用 的 输入 图 像 和 输出 图 像 ， 
但 从 输入 图 像 产生 输出 图 像 的 特定 变换 通常 是 不 知道 的 。 这 样 ， 问 题 就 是 估计 变换 函数 ， 然 后 用 它 配 
准 两 幅 图 像 。 为 搞 清楚 该 术语 ， 输 入 图 像 是 我 们 希望 变换 的 图 像 ， 而 所 谓 的 参考 图 像 是 我 们 想 要 配 准 
输入 图 像 的 图 像 。 

例如 ， 感 兴趣 的 是 对 齐 ( 配 准 ) 在 近似 相同 时 间 但 使 用 不 同 成 像 系 统 获取 的 两 幅 或 多 幅 图 像 ， 如 
幅 是 用 MRI (核磁 共振 成 像 ) 扫描 器 获取 的 图 像 ， 另 一 幅 是 用 PET( 正 电子 断层 ) 扫描 需 获 取 的 图 像 ; 或 
在 不 同 的 时 间 使 用 相同 的 设备 获取 的 图 像 ， 如 给 定位 置 间隔 几 天 、 几 个 月 甚至 几 年 的 卫星 图 像 。 无 论 
哪 种 情况 ， 合 并 这 些 图 像 或 执行 定量 分 析 ， 以 及 做 比较 ， 都 要 求 对 由 观察 视角 、 距 离 、 方 向 、 传 感 器 
分 辩 率 、 目 标 位 置 移动 及 其 他 因素 导致 的 几何 畸变 进行 修正 。 

解决 刚才 讨论 的 这 个 问题 的 主要 方法 之 一 是 使 用 约束 点 (也 称 为 控制 点 ) ， 这 些 点 是 在 输入 图 像 和 
参考 图 像 中 其 位 置 恰好 已 知 的 相应 点 。 有 很 多 选择 约束 点 的 方法 ， 可 以 交互 式 地 选择 这 些 点 ， 也 可 以 
使 用 试图 自动 检测 这 些 点 的 算法 。 在 某 些 应 用 中 ,成 像 系 统 在 成 像 传感器 中 会 谱 人 有 形 的 人 为 物质 (如 
小 金属 物 ) 。 这 会 在 系统 获取 的 图 像 上 直接 产生 一 系列 已 知 点 ( 称 为 网 状 标记 ) , 这 些 点 的 作用 是 指导 如 
何 建 立 约束 点 。 

估计 变换 函数 问题 是 建 模 问 题 之 一 。 例 如 ， 假 设 在 输入 图 像 和 参考 图 像 中 有 一 组 4 个 约束 点 。 基 
于 双 线 性 近似 的 简单 模型 由 如 下 两 式 给 出 : 


X=CV+C,wW+C,vw+e, (2.6-24) 





和 
Y=CV+CEW+C,VW+ Cy (2.6-25) 
其 中 ,在 估计 阶段 ，(v,w) 和 (x,y) 分 别 是 输入 图 像 和 参考 图 像 中 约束 点 的 坐标 。 如 果 在 两 幅 图 像 中 我 
们 有 4 对 相应 的 约束 点 ， 则 可 用 式 (2.6-24) 和 式 (2.6-25) 写 出 8 个 方程 ， 然 后 用 它们 解 出 8 个 未 知 参数 
Cis C3，… Cg o 这 些 参数 就 组 成 了 一 个 模型 ， 该 模型 把 一 幅 图 像 的 像素 位 置 变换 为 另 一 幅 需 要 配 准 的 图 
像 的 像素 位 置 。 
一 旦 有 了 系数 , 式 (2.6-24) 和 式 (2.6-25) 就 成 为 我 们 变换 输入 图 像 中 的 所 有 像素 并 生成 期 望 新 图 像 


12 的 工具 ， 如 果 约 束 点 选择 得 正确 ， 新 图 像 就 能 与 参考 图 像 配 准 。 在 4 个 约束 点 不 足以 得 到 令 人 满意 的 
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配 准 的 情况 下 ， 常 常 使 用 的 一 种 方法 是 选择 大 量 的 约束 点 ， 如 同一 个 子 图 像 那 样 , 用 一 组 4 个 约束 点 形成 


四 边 形 来 处 理 。 子 图 像 用 上 述 方法 处 理 ， 四 边 形 内 部 的 所 有 像素 使 用 由 这 些 约束 点 求 出 的 系数 进行 变 
换 。 然 后 ， 移 动 到 另 一 组 4 约束 点 ， 重复 上 述 过 程 ， 直 到 所 有 四 边 形 区 域 均 被 处 理 为 止 。 当 然 ， 也 可 


使 用 比 四 边 形 更 复杂 的 区 域 并 采用 更 复杂 的 模型 ， 例 如 使 用 最 小 均 方 算法 的 拟 合 多 项 式 。 通 常 ， 控 
制 点 的 数量 和 解决 问题 所 要 求 的 模型 的 复杂 程度 取决 于 几何 畸变 的 严重 程度 。 最 后 ,应 牢记 式 (2.6-24) 
和 式 (2.6-25) 所 定义 的 变换 ， 或 任何 针对 该 问题 的 其 他 模型 ， 以 及 输入 图 像 中 像素 空间 坐标 的 简单 映 
射 。 我 们 还 需要 使 用 前 面 讨论 的 方法 执行 灰 度 内 插 ， 以 便 给 这 些 像素 灰 度 值 赋 。 


例 2.10 图 像 配 准 。 

图 2.37 (a) 显示 了 一 幅 参考 图 像 ， 图 2.37(b) 显示 了 相同 的 图 像 ， 但 因 垂 直 和 水 平 切 变 产 生 了 几何 畸变 。 
我 们 的 目标 是 使 用 参考 图 像 得 到 约束 点 ,然后 用 约束 点 配 准 这 两 幅 图 像 。 我 们 (手工 ) 选 择 的 约束 点 靠近 图 像 
的 角 点 ， 由 白色 小 方形 点 表示 (因为 畸变 是 在 两 个 方向 上 的 线性 拉 伸 ， 因 此 仅 需 要 4 个 约束 点 ) 。 图 2.370) 
显示 了 使 用 前 面 讨 论 过 的 这 些 约束 点 来 实现 配 准 的 结果 。 我 们 注意 到 ， 配 准 并 不 完美 ， 因 为 图 2.37(c) 中 有 
明显 的 黑 边 。 图 2.37(d) 更 清楚 地 显示 了 参考 图 像 和 校正 后 的 图 像 间 配 准 的 细小 不 足 。 导致 这 种 差别 的 原因 
是 手工 选择 约束 点 时 存在 误差 。 畸 变 很 严重 时 ， 使 用 约束 点 很 难 实现 完美 的 匹配 。 
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图 2.37 图 像 配 准 ， (a) BAUR; (b) 输入 图 像 ( 几 何 畸 变 图 像 ) ， 相 应 的 约束 点 以 靠近 角 点 的 白色 小 方 
块 显示 ; 〈c) 配 准 后 的 图 像 (注意 边界 上 的 误差 ); (d) 图 (a) 和 图 (c) 的 差 . 显示 了 更 多 的 配 准 误差 


2.6.6” 癌 量 与 矩阵 操作 
多 光谱 图 像 处 理 是 使 用 向 量 和 和 矩阵 操作 的 典型 领域 。 例 如， 在 第 6 章 中 ,我 们 将 介绍 在 RGB 彩 
色 空间 中 如 何 使 用 红色 、 绿 色 、 蓝 色 分 量 图 像 来 形成 如 图 2.38 说 明了 errr ee 


彩色 图 像 。 这 里 ， 我 们 看 到 RGB 图 像 的 每 个 像素 都 有 三 个 分 量 ， 这 些 | 请 参阅 本 书 网 站 上 的 Tuorial 部 分 
分 量 可 组 织 成 一 个 列 向 量 的 形式 : | 













(2.6-26) 








式 中 , zi 是 红色 图 像 中 像素 的 亮度 ,其 他 两 个 元 素 是 相应 的 绿色 图 像 和 蓝 色 图 像 中 像素 的 亮度 。 这样， 
大 小 为 M x N 的 RGB 彩色 图 像 就 可 用 这 一 大 小 的 三 个 分 量 图 像 来 表示 ， 或 总 共用 MN 个 三 维 向 量 来 
表示 。 普通 的 多 光谱 情况 包括 n 幅 分 量 图 像 ( 见 图 1.10), 将 形成 维 向 量 。 在 第 6 章 、 第 10 章 、 第 
11 章 和 第 12 章 ， 我 们 都 使 用 这 种 形式 的 向 量 表示 : 

一 旦 像素 表示 为 向 量 ， 我 们 就 可 以 使 用 向 量 和 矩阵 理论 这 一 工具 。 例 如 ， 一 个 像素 向 量 z 和 一 个 任 
意 点 a 在 n 维 空间 的 欧 氏 距离 D 可 以 用 一 个 向 量 积 来 定义 : 
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1 1 
D(z,a)=[(z—a)" (z-a) =[ (2-4)? +E, - a)? +--+ (2, a)? f (2.6-27) 


我 们 看 到 ， 这 是 式 (2.5-1) 定义 的 二 维 欧 氏 距离 的 通 式 。 式 (2.6-27) 有 时 称 为 向 量 范 数 ， 表 示 为 |z-4a 
在 后 面 的 章节 中 ， 我 们 将 多 次 使 用 距离 计算 。 

像素 向 量 的 另 一 个 重要 优点 是 由 下 式 表 
示 的 线性 变换 : 

w= A(z-a) (2.6-28) 

式 中 , 4 是 大 小 为 mxn AERE, z 和 a 是 nxl z- A 3 
大 小 的 列 向 量 。 如 后 面 所 述 ， 这 种 类 型 的 变换 a say Gti 
在 图 像 处 理 中 的 用 途 很 多 。 DREN ED 

如 式 (2.4-2) 表示 的 那样 ,整个 图 像 可 当 作 ”图 2.38 三 幅 RGB 分 量 图 像 中 的 相应 像素 值 形成 一 个 向 量 
FERE (或 向 量 ) 来 处 理 ， 这 在 求解 大 量 数字 图 像 处 理 问 题 时 意义 重大 。 例 如 ， 我 们 可 以 把 一 幅 大 小 为 
M x N 的 图 像 描 述 为 一 个 MN x1 维 向 量 , 方法 是 用 图 像 的 第 一 行 作 为 该 向 量 的 前 N OCR, 第 二 行 作 
为 下 N 个 元 素 ， 等 等 。 用 这 种 方法 形成 的 图 像 ， 我 们 可 以 表达 应 用 更 广 范围 如 下 图 像 线性 处 理 : 

g=Hfin (2.6-29) 

式 中 , 三 表 示 输 入 图 像 的 MX x1 向 量 ,，n 表示 一 个 M xN 噪声 模式 的 MN x1 向 量 ，g 表示 处 理 后 图 像 
的 MN x1l1 问 量 ,五 是 用 于 对 输入 图 像 进行 线性 处 理 的 MN x MN 矩阵 ( 见 2.6.2 节 关 于 线性 处 理 的 介绍 ) 。 
例如 , 像 5.9 节 将 要 讨论 的 那样 , 使 用 式 (2.6-29) 为 图 像 复原 开发 一 整套 通用 技术 是 可 能 的 。 在 下 一 节 
中 ， 我 们 会 再 次 接触 矩阵 这 一 主题 ， 第 5 章 、 第 8 章 、 第 11 章 和 第 12 章 将 给 出 矩阵 在 图 像 处 理 中 的 
其 他 用 途 。 


2.6.7 图 像 变 换 


目前 为 止 讨 论 的 所 有 图 像 处 理 方法 ， 都 直接 在 图 像 像素 上 进行 操作 ， 即 直接 工作 在 空间 域 。 在 有 
些 情况 下 ， 通 过 变换 输入 图 像 来 表达 图 像 处 理 任务 ， 在 变换 域 执行 指定 的 任务 ， 之 后 再 用 反 变换 返回 
到 空间 域 ， 更 为 可 取 。 随 着 学 习 的 深入 ,我 们 会 遇 到 许多 不 同 的 变换 。 表 示 为 7(u,v) 的 二 维 线性 变换 
是 一 类 特别 重要 的 变换 ， 其 通用 形式 可 表达 为 


M-N- 


T(u,v) = Srey y)r(x, y, u,v) (2.6-30) 


x=0 y=0 
HF, f(x,y) 是 输入 图 像 ，r(x, y, u,v) 称 为 正 变换 核 ， 式 (2.6-30) X} u =0,1,2,---,M—-1 Fil v= 
0, 1, 2,… , N-11 进行 计算 。 与 以 前 一 样 , x 和 yy 是 空间 变量 , M 和 NN 是 f 的 行 和 列 , u lv 称 为 变换 变 
量 。T(w,v) 称 为 f(x,y) 的 正 变换 。 给 定 T(u,v) 后 ， 我们 可 以 用 T(w,v) 的 反 变换 还 原 f(x,y) : 








o 






分 量 图 像 3〈 蓝 色 ) 





M-l N-1 


fœ Y= 9 T, vs, yu, v) (2.6-31) 


u=0 v=0 
KP, x=0,1,2,---,M—-1,y=0,1,2,---,N-1,5(x, y, u, V) MARR, TK (2.6-30) AIK (2.6-31) — 
起 称 为 变换 对 。 
图 2.39 显示 了 在 线性 变换 域 执行 图 像 处理 的 基本 步 又。 首先， 变换 输入 图 像 ， 然 后 用 预定 义 的 操 
作 修改 该 变换 ， 最 后 ， 输 出 图 像 由 计算 修改 后 的 变换 的 反 变换 得 到 。 这 样 ， 我 们 可 以 看 出 ， 该 过 程 先 


| 从 空间 域 到 变换 域 ， 然 后 返回 空间 域 。 
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Ri T(u, v)| 






f(xy) 
空间 域 


g(x,y) 


空间 域 





变换 域 
图 2.39 线性 变换 域 中 操作 的 一 般 方 法 


例 2.11 变换 域 图 像 处 理 。 
图 2.40 显示 了 图 2.39 中 步骤 的 一 个 例子 。 在 这 种 情况 下 ， 所 用 的 变换 是 傅 里 叶 变 换 ， 在 本 节 稍 后 我 们 
将 简单 提 一 下 它 ， 第 4 章 将 对 其 进行 详细 介绍 。 图 2.40 (a) 是 一 幅 被 正弦 干扰 污染 了 的 图 像 ， 图 2.40(b) 是 
该 图 像 的 传 里 叶 变 换 的 幅度 ， 它 是 图 2.39 中 第 一 阶段 的 输出 。 如 第 4 章 所 示 ， 空 间 域 中 的 正弦 干扰 在 变换 
域 以 较 亮 的 脉冲 方式 出 现 。 在 这 种 情况 下 ， 脉 冲 是 图 2.40(b) 中 可 见 的 圆 形 模式 。 图 2.40(c) 显示 了 一 个 模板 
图 像 ( 称 为 滤波 器 ) ; 白 和 黑 分 别 代表 1 和 0s 对 于 该 例 , 图 2.39 中 第 二 个 方 框 内 的 操作 是 变换 的 结果 与 模板 
相 乘 ,以 可 靠 地 消除 干扰 脉冲 。 2.40 (d) 显示 了 最 终结 果 , 该 结果 是 通过 计算 修改 后 的 变换 的 反 变 换 得 到 
的 。 事实 上 , 我 们 恰好 可 以 看 到 基准 标志 (淡淡 的 十 字 ) ， 它 用 于 图 像 对 准 。 
abed 





图 2.40”(a) 被 正弦 干扰 污染 了 的 图 像 ，(b) 傅 里 叶 变 换 的 幅度 ， 显 示 了 干扰 能 量 脉 冲 ; (c) 用 于 消 
除 能 量 脉冲 的 模板 ; (d) 计算 修改 后 的 傅 里 叶 变换 的 反 变换 的 结果 ( 原 图 像 由 NASA 提供 ) 


如 果 
r(x, y, u, v) = F(x, u)n (y, v) (2.6-32) 
那么 所 谓 的 正 向 变换 核 是 可 分 的 。 男 外 ， 如 果 (x,y) SFr (xy). ， 则 称 变换 核 是 对 称 的 ， 从 而 有 
r(x, y, u, v) =n (x, Un(y, V) (2.6-33) 
在 前 面 的 公式 中 ,和 若 用 8 代替 >， 则 同样 的 说 明 适 用 于 反 变 换 核 。 
例 211 中 讨论 的 二 维 傅 里 叶 变 换 有 如 下 正 、 反 变换 核 : 


r(x, y, u, Ve Pm M +N) (2.6-34) 


s(x, y, u,v) = ite she (2.6-35) 


式 中 ，j = \CIL ， 因 此 这 些 核 是 复数 。 将 这 些 核 代 大 式 (2.6-30) 和 式 (2.6-31) 给 出 的 通用 变换 公式 中 ， 
可 得 出 离散 传 里 叶 变换 对 


M-i N-1 


T (u,v) = ~ > Teale /MA (2.6-36) 
x=0 y=0 
和 
M-I NA 
Fy ==> 9 Tu, ye TOEI Moy! N) (2.6-37) 
u=0 v=0 


从 基础 意义 上 说 ， 这 些 公式 在 数字 图 像 处 理 中 很 重要 ,在 第 4 Rp, FLA envi eA | 


理 和 人 手 推 导 它们 ， 然 后 在 较 宽 的 应 用 范围 使 用 它们 。 
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证 明 傅 里 叶 核 的 可 分 性 和 对 称 性 并 不 困难 (见习 题 2.25) ， 且 可 分 和 对 称 的 核 可 用 一 维 傅 里 叶 变换 
计算 二 维 傅 里 叶 变换 (见习 题 2.26) 。 当 变换 对 的 正 、 反 变换 核 满足 这 两 个 条 件 ， 且 f(x,y) 是 大 小 为 
MxM 的 方形 图 像 时 ， 式 (2.6-30) 和 式 (2.6-31) 可 表示 为 矩阵 形式 ; 

T = AFA (2.6-38) 
AH, FEUER f(x,y) 的 MxM 矩阵 [ 见 式 (2.4-2) |; 4 是 有 元 素 a; =n (i j) MxM WERE, T 
是 MxM 变换 的 结果 ， 其 值 为 Tlu v), u,v =0,1,2,---, M -1o 
JIRE, RAEE B ARANE (2.6-38) : 
BTB = BAFAB (2.6-39) 
we B= A, Ml 
F = BTB (2.6-40) 
该 式 指出 F 其 所 有 元 素 均 等 于 f(x,y) ] 可 完全 由 其 正 向 变换 复原 。 如 果 B+ A+, WH (2.6-40) 
可 得 到 一 个 近似 : 
F = BAFAB (2.6-41) 

除 健 里 叶 变 换 之 外 ,一 些 重 要 的 变换 ， 如 沃 尔 什 变换 、 哈 达 玛 变换 、 离 散 余 弦 变 换 、 哈 尔 变 换 和 
斜 变换 等 ， 可 用 式 (2.6-30) 和 式 (2.6-31) 的 形式 描述 ， 或 等 价 地 用 式 (2.6-38) 和 式 (2.6-40) 的 形式 描述 。 
我 们 将 在 后 续 章 节 讨 论 这 些 变 换 和 其 他 类 型 的 图 像 变 换 。 


26.8 概率 方法 
概率 以 很 多 方式 用 于 图 像 处 理工 作 中 。 最 简单 的 方式 是 当 我 们 以 
随机 量 处 理 灰 度 值 时 。 例 如 ， 令 z,,i=0, 1 2,…, 大 1 表示 一 幅 Mx N 


大 小 数字 图 像 中 所 有 可 能 的 灰 度 值 ， 则 在 给 定 图 像 中 灰 度 级 z 出 现 的 
概率 p(z,) 可 估计 为 





Pp(zx) = are (2.6-42) 


IP, n 是 灰 度 z 在 图 像 中 出 现 的 次 数 ，MN 是 像素 总 数 。 显 然 ， 
> pl) =! (2.6-43) 


一 且 我 们 知道 了 p(z) ， 就 可 以 得 出 许多 重要 的 图 像 特性 。 例 如 ， 平 均 灰 度 由 下 式 给 出 : 
L-1 


m= z,p(z) (2.6-44) 


k=0 


类 似 地 ， 灰 度 的 方差 是 
L-i 
o =Ñ (z, -m? p(z,) (2.6-45) 
k=0 


方差 是 z 值 关 于 均值 的 展开 度 的 度量 ， 因 此 它 是 图 像 对 比 度 的 有 用 度量 。 通 常 ， 随 机 变量 z 关于 均值 
的 第 半 阶 矩 定义 为 


L-1 
H,(z)= 》 (Er =m)" p(z,) (2.6-46) 
k=0 


BUNAEI, m(2)=1, 44(z)=0 且 jw(z)=o7 o RZ, 均值 和 方差 与 图 像 的 视觉 特性 有 明显 的 直接 关系 ， 
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高 阶 矩 更 敏感 。 例 如 ， 一 个 正三 阶 矩 指出 其 灰 度 倾向 于 比 均值 高 ， 负 三 阶 矩 则 倾向 于 比 均值 低 ， 而 零 


三 阶 矩 告诉 我 们 灰 度 近似 相等 地 分 布 在 均值 的 两 侧 。 这 些 特性 对 于 计算 目的 很 有 有 用， 但 它们 一 般 不 能 
告诉 我 们 图 像 外 观 的 更 多 内 容 。 


例 2.12 ”图像 灰 度 对 比 度 度量 时 标准 差 值 的 比较 。 

图 2.41 显 示 了 分 别 展示 低 、 中 、 高 对 比 度 的 三 幅 8 比特 图 像 。 在 这 三 ENTREE Lat Sd 
局 图 像 中 ， 像 素 灰 度 的 标准 差分 别 是 14.3, 31.6 和 49.2 个 灰 度 级 。 相 应 的 “| 以 对 比 度 值 时 ， 我 们 通常 符 代 使 用 祭 
方差 值 分 别 是 204.3, 997.8, 2424.9。 两 组 数值 告诉 我 们 相同 的 内 容 ， 但 这 “| 准 差 o。 (方差 的 均 方 根 ), 因为 其 维 数 
三 幅 图 像 可 能 的 灰 度 值 范围 是 [0， 255], 与 该 范围 相关 的 标准 差 值 与 方差 相 | 直接 取决 于 灰 度 值 。 


比 要 直观 得 多 。 








图 241 展示 了 (a) 低 对 比 度 、(b) 中 对 比 度 和 (c) 高 对 比 度 的 图 像 


后 面 我 们 会 看 到 ， 在 开发 图 像 处 理 算法 时 ， 概 率 这 一 概念 起 核心 作用 。 例 如 ， 在 第 3 章 ， 我 们 利 
用 式 (2.6-42) 的 概率 度量 推导 灰 度 变换 算法 。 在 第 5 章 中 ,我 们 使 用 概率 和 矩阵 公式 开发 图 像 复 原 算 
法 。 在 第 10 章 中 , 我 们 使 用 概率 来 分 割 图 像 , 而 在 第 11 章 中 , 我 们 用 概率 来 描述 纹理 。 在 第 12 章 中 ， 
我 们 以 概率 公式 为 基础 ， 导 出 最 佳 目标 识别 技术 。 

到 目前 为 止 ， 我 们 已 经 讨论 了 将 概率 应 用 到 单 幅 二 维 图 像 上 的 单个 随机 变量 ( 灰 度 ) 的 问题 。 考 虑 
序列 图 像 ， 我 们 可 将 时 间作 为 第 三 个 变量 。 处 理 这 一 复杂 性 的 工具 是 随机 图 像 处 理 技术 。 我 们 可 以 进 
一 步 将 整个 图 像 考虑 为 一 个 空间 随机 事件 (相对 于 一 个 点 ) 。 基 于 这 一 概念 的 处 理工 具 来 自 于 随机 域 技 
A, 在 5.8 节 中 ,我 们 将 给 出 一 个 例子 ， 说 明 如 何 像 随机 事件 那样 处 理 整个 图 像 ， 但 关于 随机 过 程 和 
随机 域 的 讨论 超出 了 本 书 的 范围 。 本 节 末 尾 提供 的 参考 文献 是 阅读 这 些 主 题 的 起 点 。 





小 结 


本 章 内容 为 后 续 讨 论 提供 了 主要 的 背景 知识 。 对 人 类 视觉 系统 的 论述 虽然 简单 ， 但 提供 了 人 有 眼 感 
知 图 像 信息 能 力 的 基本 概念 。 关于 光 和 电磁 波谱 的 讨论 是 理解 本 书 所 用 许多 图 像 来 源 的 基础 。 类 似 地 ， 
2.3.4 节 给 出 的 图 像 模型 也 是 第 4 章 中 称 为 同 态 渡 波 图 像 增强 技术 的 基础 。 

2.4 节 介绍 的 取样 和 内 插 的 概念 , 是 读者 在 实践 中 可 能 遇 到 的 许多 数字 现象 的 基础 。 掌 握 傅 里 叶 变 
换 和 频率 域 的 概念 后 ， 在 第 4 章 中 我 们 还 将 回 到 取样 及 其 分 支 问题 的 讨论 。 

2.5 节 介 绍 的 概念 是 基于 像素 邻 域 处 理 技术 的 基本 组 成 部 分 。 例 如 ， 如 第 3 章 和 第 5 章 所 示 的 那 
样 ， 邻 域 处 理 方法 是 许多 图 像 增强 和 复原 过 程 的 核心 。 在 第 9 章 中 ， 我们 将 采用 邻 域 操作 对 图 像 做 形 

态 学 处 理 ; 在 第 10 章 中 ,我 们 将 用 邻 域 处 理 分 割 图 像 ; 在 第 11 章 中 ， 我 们 用 它们 描述 图 像 。 在 应 用 

方面 ， 邻 域 处 理由 于 处 理 速度 快 ， 且 硬件 和 /或 固件 实现 简单 ， 故 在 图 像 处 理 商 业 应 用 方面 得 到 了 人 们 
的 偏爱 。 

2.6 节 的 内 容 对 于 全 书 的 阅读 很 有 帮助 , 虽然 讨论 是 介绍 性 的 , 但 可 帮助 读者 建立 数字 图 像 处 理 
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的 概念 。 如 该 节 中 提 到 的 那样 ， 介 绍 的 那些 工具 在 后 续 章 节 中 都 会 用 到 。 单 独 一 章 或 附录 无 法 充分 


论述 数学 概念 ， 因 此 后 续 章 节 会 深入 介绍 2.6 节 的 数学 工具 ， 并 说 明 如 何 运用 它们 来 解决 图 像 处 理 
问题 。 
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Gordon[1997]。Hubel[1988] 和 Cornsweet[1970] 也 很 重要 。Borm and Wolff1999] 是 讨论 光 和 电磁 波 理论 的 基本 
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( 见 2.6.3 节 ) 由 Kohler and Howell[1963] 首 次 提出 。 关 于 随机 变量 求 和 的 均值 和 方差 的 期 望 值 的 材料 见 
Peebles[1993]。 图 像 相 减 ( 见 2.6.3 节 ) 是 广泛 用 于 检测 变化 的 通用 图 像 处 理工 具 。 为 使 得 图 像 相 减 有 意义 ， 
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习题 





x21 使 用 2.1 节 提 供 的 背景 信息 ， 如 果 纸 上 的 一 个 打印 点 离 眼 睛 0.3 m 远 ,请 采用 纯 几 何方 法 ,估计 眼睛 
能 辨别 的 最 小 打印 点 的 直径 。 为 简单 起 见 ， 假 设 在 中 央 四 处 的 像 点 变 得 远 比 视网膜 区 域 的 感受 器 ( 锥 
状 体 ) 的 直径 小 时 ,视觉 系统 已 不 能 检测 到 该 点 ,进一步 假设 中 央 止 可 建 模 为 直径 为 1.5mm 的 圆 形 阵列 ， 
并 且 锥 状 体 间 的 间隔 在 该 阵列 上 均匀 分 布 。 
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当 我 们 白天 进入 一 家 黑暗 的 剧场 时 ， 在 能 看 清 并 找到 空 座 时 要 用 一 段 时 间 适 应 。2.1 节 描 述 的 视觉 

过 程 在 这 种 情况 下 起 什么 作用 ? 

虽然 图 2.10 中 未 显示 ， 但 交流 电 的 确 是 电磁 波谱 的 一 部 分 。 美 国 的 商用 交流 电 频 率 是 77 Hz。 问 这 

一 波谱 成 分 的 波长 是 多 少 米 ? 

设计 一 个 研究 细胞 、 细 菌 、 病 毒 和 蛋白质 边 界 形状 的 图 像 系统 前 端 。 在 这 种 情况 下 ， 前 端 由 光源 

和 相应 的 图 像 摄像 机 组 成 。 要 求 围 成 各 个 类 别 的 圆 形 的 直径 分 别 为 25 um, 0.5 um, 0.05 um 和 

0.005 um. 

(a) 能 用 单个 传感器 和 摄像 机 解决 这 一 成 像 问题 吗 ? 如 果 回 答 是 肯定 的 ， 试 给 出 照射 波长 和 所 需 的 
摄影 机 类 型 。 这 里 的 “类 型 ” 指 的 是 摄像 机 最 敏感 的 电磁 波谱 波段 ( 壁 如 红外 波段 ) 。 

(b) WÈ a) 中 你 的 回答 是 否定 的 ， 那么 你 建议 采用 哪 种 类 型 的 照明 光源 和 相应 的 图 像 传感器 ? 指 
出 (a) 中 所 要 求 的 光源 和 摄像 机 。 要 用 最 少数 量 的 照明 光源 和 摄像 机 解决 这 个 问题 。“ 解 决 这 个 
问题 ”是 指 能 够 分 别 检测 直径 为 25 um, 0.5 um, 0.05 hm 和 0.005 um 的 环形 细节 。 

14 mmx14 mm 的 CCD 摄像 机 芯片 有 2048x 2048 个 元 素 ,将 它 聚 焦 到 相距 0.5 m 远 的 一 个 方形 平坦 

区 域 。 该 摄像 机 每 毫米 能 分 辨 多 少 线 对 ? 摄像 机 配备 了 一 个 35 mm 镜头 。 (提示 : 成 像 处 理 模型 如 

图 2.3 所 示 ， 但 使 用 摄像 机 镜头 的 焦距 替代 眼睛 的 焦距 。) 

某 汽 车 制造 商 想 在 一 条 限量 版 跑车 生产 线 上 将 一 些 零 件 自动 安放 到 跑车 的 保险 杠 上 。 这 一 部 件 就 是 

彩色 坐标 ， 为 选择 合适 的 保险 杠 零件 ,机 器 人 需要 知道 每 辆 车 的 颜色 。 模 型 有 4 种 颜色 : 蓝 色 、 绿 

色 、 红色 和 白色 。 请 提出 一 种 基于 成 像 的 解决 方案 。 你 怎样 解决 自动 确定 每 辆 跑车 颜色 的 问题 ? 记 

住 ， 在 选择 零件 时 价格 是 最 主要 的 考虑 因素 。 

假设 中 心 在 (xo, Yo) 的 平坦 区 域 被 一 个 强度 分 布 为 


i(x,y) = Kel? + ] 


的 光源 照射 。 为 简单 起 见 , 假设 该 区 域 的 反射 是 恒定 的 并 且 等 于 1.0, 令 K=255。 如 果 图 像 使 用 上 
比特 的 强度 分 辨 率 进行 数字 化 ， 且 了 眼睛 可 检测 相 邻 像素 间 的 4 种 灰 度 突变 , 请 问 取 何 值 时 会 出 现 
可 见 的 伪 轮 廓 ? 

画 出 习题 2.7 中 k=4 时 的 图 像 。 

数字 数据 传输 通常 用 波 特 率 度量 ， 其 定义 为 每 秒 钟 传输 的 比特 数 。 通 常 ， 传 输 是 以 一 个 开始 比特 、 
一 个 字 节 (8 比特 ) 的 信息 和 一 个 停止 比特 组 成 的 包 完成 的 。 利 用 这 些 事实 ， 回 答 下 列 问题 : 

(a) 使 用 33.6K 波 特 的 调制 解 调 器 传输 一 幅 大 小 为 2048x 2048 的 256 灰 度 级 的 图 像 , 需要 几 分 钟 ? 
(b) 波 特 率 为 3000K 时 ， 即 典型 电话 DSL (数字 用 户 线 ) 的 媒介 速率 时 ， 传 输 要 用 多 长 时 间 ? 

高 清晰 度 电视 (HDTV) 使 用 1080 条 水 平 电 视线 隔行 扫描 来 产生 图 像 (每 隔 一 行 在 显像管 表面 画 一 条 
线 ， 每 两 场 形成 一 帧 ， 每 场 用 时 1/60 秒 ) 。 图 像 的 宽 高 比 是 16 : 9。 在 水 平行 数 不 变 的 情况 下 , 求 
图 像 的 垂直 分 辨 率 。 一 家 公司 已 经 设计 了 一 种 图 像 获取 系统 ， 该 系统 由 HDTV 图 像 生成 数字 图 像 。 
在 该 系统 中 ， 每 条 (水 平 ) 电 视 行 的 分 辩 率 与 图 像 的 宽 高 比 成 正比 ， 彩 色 图 像 的 每 个 像素 都 有 24 比 
特 的 灰 度 分 辨 率 ， 红 色 、 绿 色 、 蓝 色 图 像 各 8 比特 。 这 三 幅 原色 图 像 形成 彩色 图 像 。 存 储 90 分 钟 
的 一 部 HDTV 电影 需要 多 少 比特 ? 

考虑 两 个 图 像 子 集 S| AS, ， 如 下 页 右 图 所 示 。 对 于 秋 = {1}, 确定 这 两 个 子 集 是 (a) 4 邻接 的 、(b)8 邻 
接 的 ， 还 是 (c)m 邻接 的 ? 

提出 将 像素 宽度 的 8 通路 转换 为 4 通路 的 一 种 算法 。 
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2.13 ”提出 将 像素 宽度 的 m 通 路 转换 为 4 通路 的 一 种 算法 。 
2.14 ”参阅 2.5.2 REMC, 在 该 讨论 中 , 我 们 将 背景 定义 Si S> 


ARY ， 即 图 像 中 所 有 区 域 的 并 集 的 补 集 s 在 某 些 应 用 010 0 0 0000 1 110 
中 , 定义 一 个 像素 (R,) 的 子 集 为 背景 是 有 利 的 , WFE io 0 01 0 010 
不 是 孔洞 像素 区 域 ( 非 正式 地 ,我 们 认为 孔洞 是 由 区 域 像 0i0 1 to o o olo 
素 围绕 的 背景 像素 子 集 ) 。 如 何 修改 这 -定义 ， 以 便 从 OTT TT" 
(R,)° 中 排除 孔洞 像素 ? 像 “背景 是 非 孔 洞 像素 的 (R) 
像素 的 子 集 ” 这 样 的 答案 是 不 能 接受 的 。( 提 示 : 利用 连通 性 这 一 概念 。 
2.15 考虑 右 图 的 图 像 分 割 。 
太 (a) © V= {0,1,2}, 计算 p 和 g 间 4、8 和 m 通 路 的 最 短 长 度 。 如 果 在 这 Sado 0 
两 点 间 不 存在 一 个 特殊 通路 ， 试 解释 原因 。 0.1 0 4 2(q) 
(b) $ V= {2,3,4}, 重复 问题 (a) 。 PEF 3 1 d 
2.16 x (a) 对 于 点 p 和 g 间 的 D, 距离 等 于 这 两 点 间 最 短 4 通路 的 情况 ， 给 出 需 (3 0 4 2 1 
要 的 条 件 。 FAZY 3 4 
(b) 这 个 通路 唯一 吗 ? 


2.17 对 于 DD 距离 ， 重 做 习题 2.16。 
太 2.18 下 一 章 中 将 讨论 一 些 算 子 , 它们 的 功能 是 在 一 个 很 小 的 子 图 像 区 域 5 中 计算 像素 值 的 总 和 。 证 明 这 
些 算 子 都 是 线性 算 子 。 
2.19 一 个 数 集 的 中 值 < 定义 为 这 样 一 个 值 ， 数 集中 的 一 半数 值 比 它 小 ， 另 一 半数 值 比 它 大 。 例 如 ， 数 集 
{2, 3, 8, 20, 21, 25, 31} 的 中 值 是 20。 试 证 明 计 算 子 图 像 区 域 8 的 中 值 的 算 子 是 非 线性 的 。 
*2.20 ”证 明 式 (2.6-6) 和 式 (2.6-7) 的 正确 性 。[ 提示 : 从 式 (2.6-4) 开始 ， 并 利用 这 样 一 个 事实 ; 一 个 和 的 期 
望 值 就 是 期 望 值 的 和 。 ] 
2.21 考虑 两 幅 8 比特 图 像 ， 它 们 的 灰 度 级 跨越 从 0 到 255 的 全 部 范围 。 
(a) 讨论 从 图 像 (1) 中 重复 减 去 图 像 (2) 的 限制 效应 。 假 设 结果 仍然 用 8 比特 表示 。 
(b) 如 果 苏 倒 图 像 的 顺序 ， 会 产生 不 同 的 结果 吗 ? 
太 2.22 图像 相 减 通常 用 于 在 生产 线 上 检测 缺失 的 元 件 。 方 法 是 存储 一 幅 对 应 于 正确 组 装 的 “ 金 ” 图 像 ; 然 
后 ， 从 相同 产品 的 传人 图 像 中 减 去 该 图 像 。 理 想 情况 下 ， 如 果 新 产品 组 装 正确 ， 则 差 值 应 为 零 。 对 
于 缺失 元 件 的 产品 ， 在 不 同 于 金 图 像 的 位 置 ， 差 值 图 像 将 不 为 零 。 在 实际 中 ,你 认为 在 什么 条 件 下 
使 用 这 种 方法 工作 才 是 合适 的 ? 
2.23 x(a) 参考 图 2.31， 画 出 集合 (4 -B)U(B-A). 
b) 给 出 下 图 中 集合 4, B, C 中 所 示 的 阴影 集合 的 表达 式 。 每 幅 图 中 的 阴影 区 域 组 成 一 个 集合 , 因此 
应 该 对 这 三 幅 图 的 每 个 阴影 区 域 给 出 一 个 表达 式 。 








2.24 ”使 用 三 角形 区 域 替 代 四 边 形 区 域 时 ， 所 得 到 的 类 似 于 式 (2.6-24) 和 式 (2.6-25) 的 等 式 是 什么 ? 
2.25 ”证 明 式 (2.6-34) 和 式 (2.6-35) 中 的 健 里 叶 核 是 可 分 的 和 对 称 的 。 
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证 明 具 有 可 分 性 、 对 称 性 的 二 维 变 换 核 可 以 用 (1) 沿 输入 的 行 ( 列 ) 的 一 维 变换 来 计算 ; 接着 (2) 用 第 
一 步 结果 的 列 ( 行 ) 的 一 维 变换 来 计算 。 

一 家 工厂 生产 半 透 明 的 微型 聚合 物 方形 产品 。 要 求 进行 100% 的 视觉 检测 来 严格 控制 质量 ， 工 厂 管 
理 者 发 现 人 工 检测 越 来 越 贵 ， 于 是 检测 改 为 半自动 方式 。 在 每 个 检测 位 置 ， 机 械 装 置 把 聚合 物 方形 
产品 放 在 一 孝 灯 的 上 方 , 灯 位 于 光学 系统 的 下 方 ， 该 光学 系统 产生 方形 产品 的 放大 图 像 ， 图 像 完全 
落 在 大 小 为 80 mm x 80 mm 的 观察 屏 上 。 缺陷 以 暗 斑 形式 出 现 , 检测 者 的 工作 是 观察 屏幕 。 若 屏幕 
上 一 个 样品 中 出 现 了 多 个 直径 大 于 等 于 0.8 mm 的 黑 斑 ， 则 丢弃 该 样品 。 管 理 者 相信 ， 如 果 能 找到 
一 种 全 自动 的 处 理 方法 , 利润 将 提高 50%。 她 还 相信 项 目的 成 功 是 她 升迁 为 法 人 的 阶梯 。 经 过 大 量 
调研 后 ,管理 者 确定 了 解决 这 一 问题 的 方法 ， 即 用 CCD 电视 摄像 机 去 观察 每 个 检测 屏幕 ， 并 把 摄 
像 机 的 输出 送 到 能 够 检测 斑点 的 图 像 处 理 系统 中 , 测量 它们 的 直径 , 并 触发 以 前 由 检测 员 操 作 的 接 
受 和 丢弃 按钮 。 她 可 以 找到 一 个 系统 ， 只 要 最 小 的 缺陷 在 数字 图 像 中 至 少 为 2x2 像素 的 区 域 发 生 ， 
就 可 以 完成 该 工作 。 假 设 管理 者 聘任 你 来 帮助 她 确定 摄像 机 和 镜头 系统 的 参数 ， 但 要 求 你 使 用 现 有 
的 元 件 。 对 于 镜头 , 假设 该 约束 条 件 意 味 着 任何 25mm、35 mm 直至 200 mm 焦距 的 整数 倍 。 对 于 摄 
像 机 ， 这 意味 着 分 辨 率 为 512x512 像素 、1024x1024 像素 或 2048x 2048 像素 。 这 些 摄像 机 中 的 各 
个 成 像 元 素 是 大 小 为 8 hmx8 hm 的 方形 ， 成 像 元 素 的 间距 为 2 ym。 对 于 该 应 用 ， 摄 像 机 要 远 贵 于 
镜头 ， 因 此 该 问题 应 以 选择 镜头 为 基础 ， 尽 可 能 使 用 最 低 分 辨 率 的 摄像 机 来 解决 。 作 为 一 名 顾问 ， 
请 你 提供 一 份 书面 建议 , 对 你 的 结论 给 出 合理 且 详 细 的 分 析 。 使 用 习题 2.5 中 建议 的 相同 成 像 几 何 。 
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makes all the difference whether one sees darkness 
through the light or brightness through the shadows. 


David Lindsay 


术语 空间 域 指 图 像 平 面 本 身 ， 这 类 图 像 处 理 方法 直接 操作 图 像 中 的 像素 。 这 是 相对 于 变换 域 中 的 
图 像 处 理 而 言 的 , 如 2.6.7 节 所 介绍 的 和 第 4 章 将 要 详细 讨论 的 那样 , 变换 域 的 图 像 处 理 首先 把 一 幅 图 
像 变 换 到 变换 域 ， 在 变换 域 中 进行 处 理 ， 然 后 通过 反 变 换 把 处 理 结果 返回 到 空间 域 。 空 间 域 处 理 主要 
分 为 灰 度 变换 和 空间 滤波 两 类 。 如 本 章 介绍 的 那样 ， 灰 度 变换 对 图 像 的 单个 像素 进行 操作 ， 主 要 以 对 
比 度 和 羡 值 处 理 为 目的 。 空 间 滤 波 涉 及 改善 性 能 的 操作 ， 如 通过 图 像 中 每 个 像素 的 邻 域 处 理 来 锐 化 图 
像 。 接 下 来 几 节 讨 论 一 些 经 典 的 灰 度 变换 和 空间 滤波 技术 。 还 将 讨论 模糊 技术 的 某 些 细节 ， 以 便 在 灰 
度 变 换 和 空间 滤波 算法 的 公式 化 表示 中 ,并 人 不 太 精确 的 信息 。 


3.1 背景 知识 


3.1.1 灰 度 变换 和 空间 滤波 基础 

本 节 讨 论 的 所 有 图 像 处 理 技术 都 是 在 空间 域 进行 的 。 由 2.4.2 节 的 讨论 , 我 们 知道 空间 域 是 包 
含 图 像 像素 的 简单 平面 。 如 2.6.7 节 定 义 的 那样 ， 与 频率 域 (第 4 章 的 主题 ) 相反， 空间 域 技术 直 
接 操作 图 像 的 像素 。 例 如 ， 频 率 域 的 操作 在 图 像 的 傅 里 叶 变 换 上 执行 ， 而 不 是 在 图 像 本 身上 执行 。 
如 我 们 阅读 全 书 过 程 中 将 要 了 解 到 的 那样 , 某 些 图 像 处 理 任 务 在 空间 域 中 执行 更 容易 或 更 有 意义 ， 
而 另 一 些 任 务 则 更 适合 使 用 其 他 方法 。 通 常 ， 空 间 域 技术 在 计算 上 更 有 效 ， 且 执行 所 需 的 处 理 资 

本 章 讨论 的 空间 域 处 理 可 由 下 式 表 示 : 

g(x,y) =T[ f(x, y)] (3.1-1) 

RH, f(x,y) EAE, g, y) 是 处 理 后 的 图 像 , 7 是 在 点 (x,y) 的 | 有 时 也 使 用 其 他 形状 的 邻 域 . 如 加 
邻 域 上 定义 的 关于 S 的 一 种 算 子 。 算 子 可 应 用 于 单 幅 图 像 (本章 中 我 们 |E, (HT RES 


12g sie se ae Bt 止 最 好 的 邻 域 ， 因 为 它们 在 计算 机 上 
的 主要 关注 点 ) 或 图 像 集 合 ， 例 如 ， 如 2.6.3 节 中 讨论 的 那样 ， 为 降低 实现 起 来 更 为 容易 。 
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噪声 而 对 图 像 序列 执行 逐 像素 的 求 和 操作 。 图 3.1 显 示 了 式 (3.1-1) 在 单 幅 图 像 上 的 基本 实现 。 所 示 的 点 


(x,y) 是 图 像 中 的 一 个 任意 位 置 ， 包 含 该 点 的 小 区 域 是 点 (x,y) 的 邻 域 ， 如 2.6.5 节 解释 的 那样 。 邻 域 通 
常 是 中 心 在 (x,y) 的 矩形 ， 其 尺寸 要 比 图 像 小 得 多 。 

图 3.1 中 给 出 的 处 理由 以 下 几 步 组 成 : 邻 域 原 点 从 一 原点 TN 
个 像素 向 男 一 个 像素 移动 ， 对 邻 域 中 的 像素 应 用 算 子 7 ， 
并 在 该 位 置 产 生 输出 。 这 样 ， 对 于 任意 指定 的 位 置 (x,y) , 
输出 图 像 g 在 这 些 坐 标 处 的 值 ,等 于 对 了 中 以 (x,y) 为 原点 
的 邻 域 应 用 算 子 7 的 结果 ,例如 ,假设 该 邻 域 是 大 小 为 3x3 






a 


(x, v) AY 3 x 3 邻 域 





的 正方 形 , 算 子 7 定义 为 “计算 该 邻 域 的 平均 灰 度 "。 考 虑 图 像 f 

图 像 中 的 任意 位 置 ， 璧 如 (100,150) 。 假 设 该 邻 域 的 原点 位 | 空间 域 
于 其 中 心 处 ， 则 在 该 位 置 的 结果 g(100,150) 是 计算 £100, ` 

150) 和 其 8 个 邻 点 的 和 , 再 除 以 9 ( 即 由 邻 域 包 围 的 像素 灰 。 图 3 SR WAPI OS Fk (x, y) 的 一 个 
度 的 平均 值 ) 。 然 后 ， 邻 域 的 原点 移 到 下 一 个 位 置 ， 并 重复 3x3 邻 城 。 邻 或 在 图 像 中 从 “个 像 个 素 
前 面 的 过 程 ， 产 生 下 一 个 输出 图 像 g 的 值 。 该 处 理 通常 从 到 分 一 个 像素 移动 来 生成 “ 幅 给 出 图 像 
输入 图 像 的 左上 角 开 始 , 以 水 平 扫描 的 方式 逐 像素 地 处 理 , 每 次 一 行 。 当 该 邻 域 的 原点 位 于 图 像 的 边界 
上 时 ， 部 分 邻 域 将 位 于 图 像 的 外 部 。 此 时 ， 不 是 在 用 7 做 指定 的 计算 时 忽略 外 侧 令 点， 就 是 用 0 或 其 


他 指定 的 灰 度 值 填充 图 像 的 边缘 。 被 填充 边界 的 厚度 取决 于 邻 域 的 大 小 。 在 3.4.1 市 中 ,我 们 将 再 回 到 
这 一 问题 。 

就 像 在 3.4 节 中 详细 讨论 的 那样 ， 刚 刚 描述 的 过 程 称 为 空间 滤波 ， 其 中 邻 域 与 预定 义 的 操作 一 
起 称 为 空间 滤波 器 (也 称 为 空间 掩 模 、 核 、 模 板 或 窗口 ) 。 在 邻 域 中 执行 的 操作 类 型 决定 了 滤波 处 理 
的 特性 。 

最 小 邻 域 的 大 小 为 1x1。 在 这 种 情况 下 ，g 仅 取 决 于 点 (x,y) 处 的 f 值 ， 而 式 (3.1-D) 中 的 7 则 成 为 
一 个 形 如 下 式 的 灰 度 (也 称 为 灰 度 级 或 映射 ) 变换 函数 : 

s=T(r) (3.1-2) 


式 中 ， 为 表达 方便 , 令 x Fils 分 别 表示 变量 ， 即 g 和 ,在 任意 点 (x,y) 处 的 灰 度 。 例 如 ,如 果 7T(r) 有 
如 图 3.2 (a) 所 示 的 形式 , 对 了 中 每 个 像素 施 以 变换 产生 相应 g 的 像素 的 效果 , 将 比 原始 图 像 有 更 高 的 对 
比 度 ， 即 低 于 大 的 灰 度 级 更 暗 ， 而 高 于 左 的 灰 度 级 更 亮 。 这 种 技术 有 时 称 为 对 比 度 拉 伸 ( 见 3.2.4 节 ) , 
在 该 技术 中 , 低 于 大 的 > 值 被 变换 函数 压缩 在 一 个 较 窗 的 范围 * 内 ， 接 近 黑 色 ; 而 高 于 kk 的 + 值 则 与 此 
相反 。 很 明显 ， 灰 度 值 力 经 映射 得 到 了 相应 的 值 s。。 在 如 图 3.2(b) 所 示 的 极限 情况 下 ，7(r) 产生 了 一 
幅 两 级 (二 值 ) 图 像 。 这 种 形式 的 映射 称 为 疹 值 处 理 函 数 。 有 些 相当 简单 但 功能 强大 的 处 理 方法 ， 可 以 
使 用 灰 度 变换 函数 用 公式 加 以 表达 。 本 章 主要 使 用 灰 度 变换 函数 来 增强 图 像 。 第 10 章 将 使 用 灰 度 变换 
函数 来 分 割 图 像 。 结 果 仅 取决 于 一 个 点 的 灰 度 的 方法 ， 有 时 称 为 点 处 理 技术 ， 与 此 相反 ， 本 节 早 些 时 
候 讨 论 的 方法 则 称 为 邻 域 处 理 技术 。 


3.1.2 ”关于 本 章 中 的 例子 


虽然 灰 度 变换 和 空间 滤波 覆盖 了 相当 宽 的 应 用 范围 ， 但 本 章 中 的 多 数 例子 是 图 像 增 强 应 用 。 增 
强 处 理 是 对 图 像 进行 加 工 ， 使 其 结果 对 于 特定 的 应 用 比 原 始 图 像 更 合适 的 一 种 处 理 。“ 特定” 一 词 在 
这 里 很 重要 , 它 一 开始 就 确定 增强 技术 是 面向 问题 的 。 例 如 , 对 于 增强 X 射线 图 像 非常 有 用 的 方法 ， 
可 能 并 不 是 增强 由 电磁 波谱 中 远 红外 波段 拍摄 的 图 像 的 最 好 方法 。 图 像 增 强 没有 通用 的 “理论 ”。 当 
为 视觉 解释 而 处 理 一 幅 图 像 时 ， 观 察 者 将 是 判定 一 种 特定 方法 好 坏 的 最 终 裁判 员 。 在 处 理 机 器 感知 
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时 ,一 种 给 定 的 技术 很 易于 量化 。 例 如 ， 在 自动 字符 识别 系统 中 ， 最 合适 的 增强 方法 是 能 得 到 最 好 识 
别 率 的 方法 ， 这 里 不 考虑 一 种 方法 较 另 一 种 方法 的 计算 量 的 要 求 。 


ab s= T(r) S= ANF) 





图 3.2 灰 度 变换 函数 : (a) 对 比 度 拉 伸 函 数 ; (b) 阔 值 处 理 函 数 


然而 ,不 管 应 用 或 使 用 的 方法 是 什么 ， 图像 增 强 都 是 视觉 上 最 具 吸 引力 的 图 像 处 理 领 域 之 一 。 理 
所 当然 地 ， 图 像 处 理 的 初学 者 通常 会 寻找 重要 且 理 解 起 来 相对 简单 的 增强 应 用 。 因 此 ,使 用 图 像 增 强 
的 例子 来 说 明 本 章 中 论述 的 空间 处 理 方法 ， 不 仅 可 以 节省 本 书 中 处 理 图 像 增 强 的 额外 章节 ， 而 且 更 重 
要 的 是 ， 是 对 初学 者 介绍 空间 域 处 理 技术 细节 的 更 有 效 方法 。 如 我 们 将 要 看 到 的 那样 ， 随 着 本 书 的 阅 
读 进 度 ， 本 章 叙 述 的 基本 内 容 可 用 于 比 图 像 增 强 宽 得 多 的 范围 。 


3.2 一 些 基本 的 灰 度 变换 函数 


灰 度 变换 是 所 有 图 像 处 理 技术 中 最 简单 的 技术 。r 和 s 分 别 代表 处 理 前 后 的 像素 值 。 如 前 一 节 指 
出 的 那样 ， 这 些 值 与 * = 7(y) 表 达 式 的 形式 有 关 ， 其 中 7 是 把 像素 值 映射 到 像素 值 s 的 一 种 变换 。 由 
于 我 们 处 理 的 是 数字 量 ， 所 以 变换 函数 的 值 通常 存储 在 一 个 一 维 阵列 中 ， 上 且 从 + 到;s 的 映射 是 通过 查 
找 表 实现 的 。 对 于 8 比特 环境 ， 包 含 7 的 值 的 一 个 查找 表 将 有 256 条 记录 。 

作为 关于 灰 度 变换 的 介绍 ， 考 虑 图 3.3， 该 图 显示 了 图 像 增 强 常用 的 三 类 基本 函数 : 线性 函数 ( 反 
转 和 恒 等 变 换 ) 、 对 数 函 数 ( 对 数 和 反对 数 变换 ) 和 寡 律 函数 (n UREA n 次 根 变换 ) 。 恒 等 函数 是 最 一 般 
的 情况 ， 是 输出 灰 度 等 于 输入 灰 度 的 变换 ， 在 图 3.3 中 包含 它 仅 是 为 了 考虑 完整 性 。 


3.2.1 图 像 反 转 

使 用 图 3.3 中 所 示 的 反 转 变换 ， 可 得 到 灰 度 级 范围 为 [0, 工 -1] 的 一 幅 图 像 的 反 转 图 像 ， 该 反 转 图 像 
由 下 式 给 出 : 

s=L—j—r (3.2-1) 

使 用 这 种 方式 反 转 一 幅 图 像 的 灰 度 级 ， 可 得 到 等 效 的 照片 底片 。 这 种 类 型 的 处 理 特 别 适用 于 增强 嵌入 
图 像 暗色 区 域 中 的 白色 或 灰色 细节 , 特别 是 当 黑色 面积 在 尺寸 上 占 主导 地 位 时 。 图 3.4 显 示 了 一 个 例子 。 
原 图 像 是 一 幅 数字 乳房 又 射线 照片 , 其 中 显示 有 一 小 块 病变 。 尽管 事实 上 两 幅 图 在 视觉 内 容 上 都 一 样 ， 
但 应 注意 ， 在 这 种 特殊 情况 下 ， 分 析 乳 房 组 织 时 使 用 反 转 图 像 会 容易 得 多 。 


3.2.2 ”对 数 变换 


图 3.3 中 的 对 数 变换 的 通用 形式 为 
s=clog(1+r) (3.2-2) 
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式 中 c 是 常数 ， 并 假设 r=0。 图 3.3 中 对 数 曲 线 的 形状 表明 ,该 变换 将 输入 中 范围 较 罕 的 低 灰 度 值 映 射 为 
输出 中 范围 较 宽 的 灰 度 值 , 或 将 输入 中 范围 较 宽 的 高 灰 度 值 映射 为 输出 中 范围 较 容 的 灰 度 值 。 我 们 使 用 
这 种 类 型 的 变换 来 扩展 图 像 中 的 暗 像素 值 ， 同 时 压缩 更 高 灰 度 级 的 值 。 反 对 数 变 换 的 作用 与 此 相反 。 
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图 3.3 一 些 基本 的 灰 度 变换 函数 。 所 有 曲线 已 被 缩放 到 适合 显示 的 范围 
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图 3.4 (a) 原始 数字 乳房 X 射线 照片 ，(b) 使 用 式 (3.2-1) 给 出 的 反 转 
变换 得 到 的 反 转 图 像 ( 图 像 由 G. E. Medical Systems 公司 提供 ) 


具有 图 3.3 所 示 对 数 函 数 的 一 般 形 状 的 任何 曲线 ， 都 能 完成 图 像 灰 度 级 的 扩展 /压缩 ， 但 下 一 节 讨 
论 的 震 律 变换 更 适用 于 这 一 目的 。 对 数 函 数 有 一 个 重要 特征 ， 即 它 压 缩 像素 值 变 化 较 大 的 图 像 的 动态 
范围 。 像 素 值 有 较 大 动态 范围 的 一 个 典型 应 用 说 明 是 傅 里 叶 频 谱 ， 这 将 在 第 4 章 中 讨论 。 现 在 ， 我 们 
只 关注 图 像 的 频谱 特征 。 通 常 ， 频 谱 值 的 范围 从 0 到 10" ， 甚 至 更 高 。 尽 管 计算 机 能 毫 无 问题 地 处 理 
这 一 范围 的 数值 ， 但 图 像 的 显示 系统 通常 不 能 如 实地 再 现 如 此 大 范围 的 灰 度 值 。 因 而 ， 最 终结 果 是 许 
多 重要 的 灰 度 细节 在 典型 的 传 里 时 频谱 的 显示 中 丢失 了 。 

作为 对 数 变换 的 说 明 ， 图 3.5 (a) 显示 了 值 域 为 0~1.5x10" 的 传 里 叶 频谱 。 当 这 些 值 在 一 个 8 
比特 系统 中 被 线性 地 缩放 显示 时 ， 最 亮 的 像素 将 支配 该 显示 ， 频 谱 中 的 低 值 (恰恰 是 重要 的 ) 将 损 
失掉 。 图 3.5 (a) 中 相对 较 小 的 图 像 区 域 ,人 鲜明 地 体现 了 这 种 支配 性 的 效果 ， 而 作为 黑色 则 观察 不 到 。 圭 
代 这 种 显示 数值 的 方法 ， 如 果 我 们 先 对 这 些 频谱 值 应 用 式 (3.3-2) (此 时 c=1) ,那么 得 到 的 值 域 就 变 为 上 2 
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0~ 6.2 。 图 3.5 b) 显示 了 线性 缩放 这 个 新 值 域 并 在 同一 个 8 比特 显示 系统 中 显示 频谱 的 结果 。 由 这 些 
图 片 可 以 看 出 ,与 未 改进 显示 的 频谱 相 比 ， 这 幅 图 像 中 可 见 细节 的 丰富 程度 很 明显 。 我 们 在 关于 图 像 
处 理 的 出 版 物 中 看 到 的 绝 大 多 数 傅 里 叶 频 谱 ， 都 用 这 种 方式 标定 过 





图 3.5 (a) 傅 里 叶 频 谱 ，(b) 应 用 式 (3.2-2) 中 的 对 数 变 换 (c= 1) 的 结果 
3.2.3 we MS) 变换 
震 律 变换 的 基本 形式 为 


s=cr’ (3.2-3) 
fc Aly 为 正常 数 。 有 时 考虑 到 偏 移 量 ( 即 输入 为 0 时 的 一 个 可 度量 输出 ) ， 式 (3.2-3) WW s = 
c(r+e) 。 然 而 ,， 偏 移 量 一 般 是 显示 标定 问题 , 因此 通常 在 式 (3.2-3) 中 忽略 不 计 。 对 于 不 同 的 y 值 ，s 
与 关 的 关系 曲线 如 图 3.6 所 示 。 与 对 数 变换 的 情况 类 似 ， 部 分 y 值 的 寡 律 曲线 将 较 罕 范围 的 暗色 输入 值 
映射 为 较 宽 范围 的 输出 值 ， 或 将 较 宽 范围 的 高 灰 度 级 输入 值 映射 为 较 罕 范围 的 输出 值 。 人 然而， 与 对 数 
函数 不 同 的 是 ,我 们 注意 到 ， 随 着 y 值 的 变化 ， 我 们 将 简单 地 得 到 一 族 可 能 的 变换 曲线 。 正 如 所 预期 
的 那样 ,在 图 3.6 中 , 我 们 看 到 ，y >1 的 值 所 生成 的 曲线 和 y <1 的 值 所 生成 的 曲线 的 效果 完全 相反 
最 后 ,我们 注意 到 式 (3.2-3) 在 c=y =1 时 简化 成 了 恒 等 变 换 
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输入 灰 度 级 / 
图 3.6 AF] y (EA s= cr* 曲线 (所 有 情况 c= 1) 。 所 有 曲线 均 已 被 缩放 到 适合 于 显示 的 范围 
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用 于 图 像 获 取 、 打 印 和 显示 的 各 种 设备 根据 宕 律 来 产生 响应 。 习 惯 上 ， 和 圭 律 方程 中 的 指数 称 为 伽 
马 [ 故 在 式 (3.2-3) 中 使 用 这 一 符号 用 于 校正 这 些 需 律 响应 现象 的 处 理 称 为 伽 马 校正 。 例 如 ， 阴 极 
射线 管 (CRT) 设备 有 一 个 灰 度 -电压 响应 , 该 响应 是 一 个 指数 变化 范围 约 为 1.8 ~ 2.5 的 寡 函 数 。 在 图 3.6 
H, 用 y=2.5 时 的 参考 曲线 , 我 们 看 到 ,这 种 显示 系统 产生 的 图 像 往往 要 比 期 望 的 图 像 暗 。 图 3.7 中 说 
明了 这 一 结果 。 图 3.7 (a) 显示 了 一 幅 输入 到 监视 器 的 简单 灰 度 斜坡 (渐变 ) 图 像 。 如 期 望 的 那样 ， 监 视 器 
表现 出 了 输出 比 输入 暗 ， 如 图 3.7 tb) 所 示 。 在 这 种 情况 下 ， 伽 马 校正 很 简单 。 我 们 需要 做 的 只 是 将 图 像 
输入 到 监视 器 前 进行 预 处 理 ， 即 进行 *= 刀 2” = 六 变换。 结果 如 图 3.7(c) 所 示 。 当 输入 到 相同 的 监视 器 
时 ， 这 一 伽 马 校正 过 的 输入 产生 外 观 上 接近 于 原 图 像 的 和 输出， 如 图 3.7(d) 所 示 。 类 似 的 分 析 也 适用 于 其 
他 图 像 设备 ， 如 扫描 仪 和 打印 机 。 唯 一 的 不 同 是 随 设备 而 定 的 伽 马 值 (Poynton[1996]) 。 


ab 4 
cd j 





在 监视 器 上 观察 到 的 原 图 像 





经 在 同一 监视 器 上 观察 到 
it le 的 经 伽 马 校正 后 的 图 像 


图 3.7  (a) 亮 度 斜 坡 图 像 ; O) 在 伽 马 值 为 2.5 的 模拟 监视 器 上 观察 到 的 图 像 ; (c) efi Bre 
正 后 的 图 像 ; (d) 在 同一 监视 器 上 观察 到 的 经 伽 马 校正 后 的 图 像 。 比 较 图 (d) 和 图 (a) 


若 所 关注 的 是 在 计算 机 屏幕 上 精确 显示 图 像 ， 则 伽 马 校正 很 重要 。 不 恰当 校正 的 图 像 看 起 不 是 太 
亮 ， 就 是 太 暗 。 试 图 精确 再 现 彩色 也 需要 伽 马 校正 的 一 些 知识 ， 因 为 改变 伽 马 值 不 仅 会 改变 亮度 ， 而 
且 会 改变 彩色 图 像 中 红 、 绿 、 蓝 的 比率 。 随 着 数字 图 像 在 互联 网 上 商业 应 用 的 增多 ， 在 过 去 几 年 里 ， 伽 马 
校正 逐渐 变 得 越 来 越 重 要 。 为 流行 网 站 创建 被 几 百 万 人 浏览 的 图 像 是 很 平常 的 事 ， 因 为 大 多 数 浏览 者 会 有 
不 同 的 监视 器 和 /或 监视 器 设置 。 有 些 计算 机 系统 甚至 会 内 置 部 分 伽 马 校正 。 此 外 ， 目 前 的 图 像 标准 并 不 
包含 创建 图 像 的 伽 马 值 ， 因 此 问题 进一步 复杂 化 了 。 由 于 这 些 限 制 , 在 网 站 中 存储 图 像 时 , 一 种 合理 的 
方法 是 用 伽 马 值 对 图 像 进 行 预 处 理 ， 这 个 伽 马 值 代表 了 在 开放 的 市 场 中 , 在 任意 给 定时 间 点 ， 各 种 型 
号 监视 器 和 计算 机 系统 所 期 望 的 “平均 值 ”。 


例 3.1 使 用 宫 律 变换 增强 对 比 度 。 

除 伽 马 校正 外 ， 震 律 变换 在 通用 对 比 度 操作 中 也 很 有 用 。 图 3.8(a) 显示 了 人 体 胸 部 以 上 省 椎 骨折 错位 
和 次 髓 受到 影响 的 一 幅 核 磁 共振 (MRD 图 像 。 在 胸椎 垩 直 中 心 附近 ， 即 图 中 从 上 往 下 约 1/4 处 ， 骨 折 显 
而 易 见 。 由 于 所 给 图 像 整体 偏 暗 ， 因 而 需要 扩展 灰 度 级 。 这 可 使 用 指数 为 分 数 的 军 律 变换 来 完成 。 使 用 
式 G3.2-3) 给 出 的 寡 律 变换 来 处 理 图 3.8 (a) , 得 到 示 于 图 中 的 其 他 几 幅 图 像 。 对 应 于 图 (b) 到 图 Cd) 的 伽 马 值 
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分 别 为 0.6, 0.4 AI 0.3 (e 始终 为 1)。 我 们 注意 到 ， 随 着 伽 马 值 从 0.6 减 小 到 0.4， 更 多 的 细节 变 得 可 见 。 当 
伽 马 值 进一步 减 小 到 0.3 时 , 背景 中 的 细节 得 到 了 进一步 增强 , 但 对 比 度 会 降低 到 图 像 开 始 有 轻微 “冲淡 ” 
外 观 的 程度 ， 尤 其 是 在 背景 中 。 比 较 所 有 的 结果 ， 我 们 看 到 在 对 比 度 和 分 辩 细 节 方 面 ， 最 好 的 增强 出 现在 
”=0.4 时 。 在 这 幅 特 定 图 像 中 ，7 = 0.3 的 值 是 一 个 近似 极限 点 ， 低 于 该 值 对 比 度 会 下 降 到 令 人 难以 接受 
的 程度 。 


abcd 
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图 3.8 (a) AAP DT ee VR CMRI); (b)~(d) 4 c= 1 而 yy 分别 等 于 0.6,0.4,0.3 时 应 用 式 (3.2-3) 
给 出 的 变换 的 结果 ( 原 图 像 由 Vanderbilt 大 学 医学 中 心 辐射 学 与 放射 学 系 的 David R. Pickens 博士 提供 ) 


例 3.2 器 律 变换 的 另 一 个 说 明 。 

图 3.9(a) 显示 了 一 个 与 图 3.8 (a) 相 反 的 问题 。 要 处 理 的 图 像 现在 有 “冲淡 ”的 外 观 ， 表 明 需 要 进行 灰 
度 级 压缩 ,可 以 用 式 (3.2-3) 并 令 y>1 来 完成 这 一 处 理 。y = 3.0, 4.0 和 5.0 时 ,图 3.9 (a) 的 处 理 结果 如 图 3.9 (b) 
到 (d) 所 示 。 伽 马 值 取 3.0 和 4.0 时 ， 可 得 到 合适 的 结果 ， 且 后 者 由 于 有 较 高 的 对 比 度 而 显示 出 更 邻 人 满意 
的 效果 。y = 5.0 时 得 到 的 结果 中 有 些 地 方太 暗 ， 因 而 丢失 了 一 些 细节 ， 如 左上 方 主 路 左 侧 的 暗色 区 域 就 
是 这 样 的 一 个 例子 。 


abcd 








图 3.9 (a) 航拍 图 像 (b)~(d) S c=1 Hy 分 别 等 于 3.0,4.0 和 5.0 时 
应 用 式 (3.2-3) 给 出 的 变换 的 结果 (此 例 的 原 图 像 由 NASA 提供 ) 

3.2.4 ”分 段 线 性 变换 函数 

前 面 三 节 中 所 讨论 方法 的 一 个 补充 方法 是 使 用 分 段 线性 函数 。 分 段 线性 函数 较 我 们 已 经 讨论 
过 的 函数 类 型 的 主要 优点 是 ， 其 形式 可 以 任意 复杂 。 事 实 上 ， 正 如 我 们 即将 看 到 的 那样 ， 一 些 
重要 变换 的 实际 实现 可 仅 由 分 段 函 数 来 明确 地 表达 。 分 段 函数 的 主要 缺点 是 其 技术 说 明 要 求 用 
户 输入 ， 

对 比 度 拉 什 

最 简单 的 分 段 线性 函数 之 一 是 对 比 度 拉 伸 变换 。 低 对 比 度 图 像 由 照明 不 足 、 成 像 传感器 动态 范围 
太 小 、 图 像 获取 过 程 中 镜头 光圈 设置 错误 引起 。 对 比 度 拉 伸 是 扩展 图 像 灰 度 级 动态 范围 的 处 理 ， 因 此 
可 以 跨越 记录 介质 和 显示 装置 的 全 部 灰 度 范围 。 
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图 3.10(a) 显示 了 一 个 用 于 对 比 度 拉 伸 的 典型 变换 。 点 (is ) 和 点 (1, , 8) 的 位 置 控制 变换 函数 的 形 
Ro #7 =s 且 =s,， 则 变换 为 一 线性 函数 ， 产 生 没 有 变化 的 灰 度 级 。 若 =,s, =0 且 s, = 工 -1， 
则 变换 变 为 闪 值 处 理 函数 ， 产 生 一 幅 二 值 图 像 ， 如 图 3.2(b) 所 示 。(n,si) 和 (w,s,) 的 中 间 值 产生 输出 
图 像 的 不 同 程度 的 灰 度 级 扩展 ， 从 而 影响 输出 图 像 的 对 比 度 。 一 般 情 况 下 ， 假 设 rsr AL sis, A 
是 单 值 的 且 单 调 递增 的 。 这 一 条 件 保持 了 灰 度 级 的 次 序 ， 从 而 避免 了 在 处 理 后 的 图 像 中 产生 人 为 的 灰 
度 错误 。 


| | 





3L/4 


输出 灰 度 级 5 








(ri 51) 
0 | | 
0 LA L/min 
输入 灰 度 级 abed 
图 3.10 ”对比度 拉 伸 : (a) 变换 函数 的 形式 ; ORR EEEN; (c) 对 比 度 拉 伸 的 结果 ; (d) BEAD 
的 结果 ( 原 图 像 由 位 于 堪培拉 的 澳大利亚 国立 大 学 生物 科学 研究 院 的 Roger Heady 博士 提供 ) 

图 3.10 (b) 显示 了 一 幅 8 比特 低 对 比 度 图 像 。 图 3.10(c) 显示 了 对 比 拉 伸 后 的 效果 ， 得 到 该 效果 的 参数 
设置 如 下 : (s1) = nin 0) AL. $2) = ars LD) HP rain 和 六 。 分 别 表示 图 像 中 的 最 小 灰 度 级 和 最 
大 灰 度 级 。 因 此 ,变换 函数 把 灰 度 级 由 其 原 范围 线性 地 拉 伸 至 整个 范围 [0,L 一 1] 。 最 后 ， 图 3.10(d) 显示 了 
使 用 前 面 定义 的 (r,s)=(m,0) 和 (w,s;)= (m, L-1) BEARS ZR, 其中，m 是 图 像 的 平均 
灰 度 级 。 得 到 这 些 结果 的 原 图 像 ， 是 电子 显微镜 扫描 并 放大 约 700 倍 的 花粉 图 像 。 

灰 度 级 分 层 

突出 图 像 中 特定 灰 度 范围 的 亮度 通常 很 重要 ， 其 应 用 包括 增强 某 些 特征 ， 如 卫星 图 像 中 的 水 体 和 
X 射线 图 像 中 的 缺陷 。 通 常 称 之 为 灰 度 级 分 层 的 处 理 可 以 由 许多 方法 实现 ， 但 它们 中 的 大 多 数 是 两 种 
基本 方法 的 变形 。 一 种 方法 是 将 感 兴趣 范围 内 的 所 有 灰 度 值 显示 为 一 个 值 譬如 “白色 ”) ， 而 将 其 他 
灰 度 值 显示 为 另 一 个 值 ( 璧 如 “黑色 ”) 。 如 图 3.11 (a) 所 示 ， 该 变换 产生 了 一 幅 二 值 图 像 。 第 二 种 方法 
以 图 3.11 (b) 所 示 的 变换 为 基础 , 使 感 兴趣 范围 的 灰 度 变 亮 (或 变 暗 ) , 而 保持 图 像 中 的 其 他 灰 度 级 不 变 。 
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图 3.11 (a) 这 一 变换 突出 了 范围 [4;B] 内 的 灰 度 ， 而 将 所 有 其 他 灰 度 降低 到 了 一 个 更 低 
的 级 别 ; (b) 这 一 变换 突出 了 范围 [4,B] 内 的 灰 度 ， 而 保持 所 有 其 他 灰 度 级 不 变 
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例 3.3 灰 度 级 分 层 。 

图 3.12(a) 是 一 幅 靠近 肾脏 区 域 的 大 动脉 血管 造影 照片 ( 见 1.3.2 节 对 这 幅 图 像 的 详细 解释 ) 。 该 例 的 目 
的 是 使 用 灰 度 级 分 层 来 突出 主要 血管 , 使 其 更 亮 一 些 ,如同 注射 造影 剂 的 效果 那样 。 图 3.12 (b) 显示 了 使 用 
图 3.11 (a) 给 出 的 变换 的 结果 ， 所 选 范 围 接近 数值 的 顶端 ， 因为 感 兴趣 的 范围 比 背 景 亮 。 该 变换 的 最 终结 
是 血管 和 肾脏 部 分 显现 白色 ， 而 其 他 灰 度 显示 为 黑色 。 这 种 类 型 的 增强 产生 了 一 幅 二 值 图 像 ， 它 对 于 研究 
(用 于 检测 血管 堵塞 的 ) 造影 剂 的 流动 是 很 有 用 的 。 

另 一 方面 ， 如 果 我 们 的 兴趣 在 于 研究 感 兴趣 区 域 的 实际 灰 度 值 ， 则 可 使 用 图 3.11 (b) 中 的 变换 。 
图 3.12 (c) 显示 了 使 用 这 样 一 个 变换 后 的 结果 : 近似 等 于 平均 灰 度 的 中 等 灰 度 区 域 的 灰 度 范围 设置 为 黑色 ， 
而 其 他 灰 度 保持 不 变 。 这 里 ,我 们 看 到 主 血管 和 肾脏 区 域 部 分 的 灰 度 级 色调 保持 不 变 。 当 我 们 的 兴趣 是 测 
量 系列 图 像 中 造影 剂 随 时 间 的 流动 时 ， 这 种 结果 是 很 有 用 的 。 





图 3.12 ” (a) 大 动脉 血管 造影 照片 ，(b) 使 用 图 3.11 (a) 中 说 明 的 分 层 变 换 的 结果 ， 所 选 的 重要 灰 度 
范围 为 灰 度 级 的 高 端 ，(c) 使 用 图 3.11 (b) 中 的 变换 的 结果 ， 所 选区 域 置 为 黑色 ， 以 便血 
管 和 肾脏 区 域 的 灰 度 保 持 不 变 ( 原 图 像 由 密歇根 大 学 医学 院 的 Thomas R. Gest 博士 提供 ) 
比特 平面 分 层 


像素 是 由 比特 组 成 的 数字 。 例 如 ， 在 256 级 灰 度 图 像 中 ， 每 个 像素 的 灰 度 是 由 8 比特 (也 就 是 1 个 
字 妆 ) 组 成 的 。 蔡 代 突 出 灰 度 级 范围 ， 我 们 可 突出 特定 比特 来 突出 整个 图 像 的 外 观 。 如 图 3.13 说 明 的 
那样 ， 一 幅 8 比特 图 像 由 8 个 1 比特 平面 组 成 ， 其 中 平面 1 包含 图 像 中 所 有 像素 的 最 低 阶 比特 ， 而 平 
面 8 包含 图 像 中 所 有 像素 的 最 高 阶 比 特 。 


一 个 8 比特 字 节 
E 比特 平面 8 


比特 平面 
a 〈 最 低 阶 比特 ) 


图 3.13 一 幅 8 比特 图 像 的 比特 平面 表示 


abe 


. 


图 3.14 (a) 显示 了 一 幅 8 比特 灰 度 图 像 ， 图 3.14 (b) 到 图 3.14 Gi) AEE 8 个 1 比特 平面 ， 图 3.14 (b) 对 

应 于 最 低 阶 比特 。 很 明显 ，4 个 高 阶 比特 平面 ， 特 别 是 最 后 两 个 比特 平面 ， 包 含 了 在 视觉 上 很 重要 的 

大 多 数 数 据 。 低 阶 比特 平面 在 图 像 中 贡献 了 更 精细 的 灰 度 细节 。 原 图 像 有 一 个 灰 度 为 194 的 灰色 边界 
140) 注意 ， 对 应 于 某 些 比特 平面 的 灰 度 边界 是 黑色 (0) ， 而 其 他 灰 度 边 界 是 白色 (1) 。 为 了 解 其 原因 ， 考 虑 


J 
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一 个 像素 ， 壁 如 图 3.14 (a) 中 最 低 边界 中 部 的 一 个 像素 。 从 最 高 阶 平面 开始 ,这些 比特 平面 中 相应 像素 


的 值 分 别 为 1 1 0 0 00 1 0， 它 是 十 进 制 数 194 的 三 进 制 表示 。 原 图 像 中 任意 一 个 像素 的 值 ， 可 以 类 似 











mT aS 
wag 
= m e 


SW eos 


图 3.14 一 幅 大 小 为 500x1192 像素 的 8 比特 灰 度 图 像 ，(b)~ (人 比特 平面 1 到 8， 
其 中 比特 平面 1 对 应 于 最 低 阶 比特 。 每 个 比特 平面 都 是 一 幅 二 值 图 像 


根据 灰 度 变换 函数 ， 显 示 一 幅 8 比特 图 像 的 第 8 个 比特 平面 并 不 困难 ， 它 可 用 阅 值 灰 度 变换 函数 
处 理 输入 图 像 得 到 二 值 图 像 ， 该 函数 将 0~127 之 间 的 所 有 灰 度 映射 为 0， 而 将 128~255 之 间 的 所 有 灰 
度 映 射 为 1。 图 3.14 中 中 的 二 值 图 像 就 是 使 用 这 种 方式 得 到 的 。 得 到 生成 其 他 比特 平面 的 灰 度 变换 函 
数 的 方法 ， 将 作为 一 个 练习 留 给 读者 (见习 题 3.4) 

把 一 幅 图 像 分 解 为 比特 平面 ， 对 于 分 析 图 像 中 每 个 比特 的 相对 重要 性 很 有 用 ， 这 一 处 理 可 帮助 
我 们 确定 用 于 量化 该 图 像 的 比特 数 的 充分 性 。 此 外 ， 这 种 类 型 的 分 解 对 图 像 压 缩 第 8 章 的 主题 ) 也 
很 有 用 ,在 图 像 压 缩 中 , 重建 一 幅 图 像 时 所 用 的 平面 要 比 全 部 平面 少 。 例 如 ， 图 3.15 (a) 显示 了 使 用 
比特 平面 8 和 比特 平面 7 重建 的 一 幅 图 像 。 重 建 是 使 用 第 ”个 平面 的 像素 乘 以 常数 2” 来 完成 的 。 
与 把 第 n 个 有 意义 的 二 进 制 比特 变换 成 十 进 制 相 比 ， 工 作 量 相同 。 所 用 的 每 个 比特 平面 与 一 个 相应 
的 常数 相 乘 ， 然 后 将 所 有 的 比特 平面 相 加 得 到 灰 度 图 像 。 这 样 ， 为 得 到 图 3.15 (a) ,我 们 用 128 RA 
比特 平面 8， 用 64 乘 以 比特 平面 7， 然后 把 这 两 个 比特 平面 相 加 。 虽 然 复 原 了 原 图 像 的 主要 特征 ， 
但 重建 后 的 图 像 显得 有 些 平淡 ， 特 别 是 在 背景 区 域 。 这 并 不 奇怪 ， 因 为 两 个 平面 仅 能 产生 4 个 不 同 
的 灰 度 级 。 把 平面 6 加 入 到 重建 中 可 改善 这 种 情况 ， 如 图 3.15 (b) 所 示 。 注意 , 该 图 像 的 背景 有 可 感 
知 的 伪 轮 廓 。 这 一 效应 可 通过 在 重建 中 加 入 第 5 个 平面 来 明显 降低 ， 如 图 3.15 (c) 所 示 。 在 重建 中 使 
用 更 多 的 平面 对 图 像 的 外 观 不 会 有 更 大 贡献 。 因 而 ， 我 们 可 以 得 出 这 样 的 结论 : 存储 4 个 高 阶 比特 
平面 将 允许 我 们 以 可 接受 的 细节 来 重建 原 图 像 。 存 储 这 4 个 平面 代替 原始 图 像 可 减少 50% 的 存储 量 
(不 考虑 存储 体系 结构 问题 ) 。 







图 3.15 (a) 使 用 比特 平面 8 和 7 重建 的 图 像 ; (b) 使 用 比特 平面 8,7 和 6 重建 的 图 像 ; 
(c) 使 用 比特 平面 8, 7, 6 和 5 重建 的 图 像 。 将 图 (c) 与 图 3.14 (a) 进行 比较 
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3.3 直方 图 处 理 


灰 度 级 范围 为 [0, 工 -局 的 数字 图 像 的 直方 图 是 离散 函数 Ki) = 下， 其 中 六 是 第 大 级 灰 度 值 , n 是 
图 像 中 灰 度 为 的 像素 个 数 。 在 实践 中 ， 经 常用 乘积 MN 表示 的 图 像 总 像素 除 每 个 分 量 来 归 一 化 直方 
图 ,通常 M 和 N 是 图 像 的 行 数 和 列 数 。 因 此 ， 归 一 化 后 的 直方 图 由 a 
Pi) =m, /MN 给 出 ,其 中 k=0，1，…, 工 -1。 简单 地 说 ，p(n) 是 灰 | om TERA, 
度 级 在 图 像 中 出 现 的 概率 的 估计 。 归 一 化 直方 图 的 所 有 分 量 之 和 应 
等 于 1。 

直方 图 是 多 种 空间 域 处 理 技术 的 基础 。 直 方 图 操作 可 用 于 图 像 增强 ， 如 本 节 所 示 。 除 了 提供 有 用 
的 图 像 统计 资料 外 ， 在 后 续 章 节 中 我 们 还 会 看 到 直方 图 中 的 固有 信息 在 其 他 图 像 处 理应 用 中 也 非常 有 
用 ， 如 图 像 压 缩 与 分 割 。 直 方 图 在 软件 中 计算 简单 ， 而 且 有 助 于 商用 硬件 实现 ， 因 此 已 成 为 实时 图 像 
处 理 的 流行 工具 。 

作为 灰 度 变 换 的 直方 图 处 理 的 介绍 , 我 们 考虑 图 3.16, 它 是 图 3.10 所 示 的 以 4 个 基本 灰 度 级 为 特征 的 
花粉 图 像 : 暗 图 像 、 亮 图 像 、 低 对 比 度 图 像 和 高 对 比 度 图 像 。 图 的 右 侧 显示 了 与 这 些 图 像 对 应 的 直方 图 。 
每 个 直方 图 的 水 平 轴 对 应 于 灰 度 值 ;， EARI TE AC) = nn 或 妥 一 化 后 的 值 pr) =n, /MN o 这样， 
直方 图 就 可 以 简单 地 视 为 h(n ) = n, SOF r, BK p(y.) =n, /MN 对 应 于 六 的 图 形 。 

我 们 注意 到 ， 在 暗 图 像 中 ， 直 方 图 的 分 量 集中 在 灰 度 级 的 低 ( 暗 ) 端 。 类 似 地 ， 亮 图 像 直方 图 的 分 
量 则 倾向 于 灰 度 级 的 高 端 。 低 对 比 度 图 像 具 有 较 窗 的 直方 图 , 日 集中 于 灰 度 级 的 中 部 。 对 于 单 色 图 像 ， 
这 意味 着 暗淡 ， 好 像 灰 度 被 冲淡 了 一 样 。 最 后 ， 我 们 看 到 ， 高 对 比 度 图 像 中 直方 图 的 分 量 覆 盖 了 很 宽 
的 灰 度 级 范围 ， 而 且 像 素 的 分 布 没有 太 不 均匀 ， 只 有 少量 垂 线 比 其 他 的 高 许多 。 直 观 上 ， 可 以 得 出 这 
样 的 结论 : 若 一 幅 图 像 的 像素 倾向 于 占据 整个 可 能 的 灰 度 级 并 且 分 布 均匀 ， 则 该 图 像 会 有 高 对 比 度 的 
外 观 并 展示 灰色 调 的 较 大 变化 。 最 终 效果 将 是 一 幅 灰 度 细节 丰富 且 动 态 范围 较 大 的 图 像 。 很 快 将 会 证 
明 ， 仅 依靠 输入 图 像 直方 图 中 的 可 用 信息 就 可 开发 出 一 个 变换 函数 来 自动 地 实现 这 种 效果 。 


3.3.1 直方 图 均衡 


考虑 连续 灰 度 值 ， 并 用 变量 > 表示 待 处 理 图 像 的 灰 度 。 通 常 ， 我 们 假设 > 的 取 值 区 间 为 [0, 工 -1 ， 
且 ”=0 表 示 黑 色 ， 7 = 工 -1 表 示 白 色 。 在 ”满足 这 些 条 件 的 情况 下 ， 我 们 将 注意 力 集 中 在 变换 形式 
s=T(r),0<r<L-1 (3.3-1) 
上 ( 灰 度 映射 ) ， 对 于 输入 图 像 中 每 个 具有 + 值 的 像素 产生 一 个 输出 灰 度 值 *。 我 们 假设 
(a) T(r) 在 区 间 0 <r<L-1 上 为 单调 递增 函数 ?。 
b) 40 <r<L-1h, 0<T@) <L-1, 
TERE —2EASP, RIHAR 
r=Po(s),0-<5 <L-1 (3.3-2) 
在 这 种 情况 下 ， 条 件 (a) 改 为 


(a) THEKE 0 <xr<L-1 上 是 一 个 严格 单调 递增 函数 。 


D BMF n > ATO T) , WERE T(r) 是 单调 递增 的 。 若 对 于 刀 >n A TO) > T) , 则 称 函 数 7(r) 是 严格 单调 递增 的 。 
类 似 的 定义 适用 于 单调 递减 函数 。 
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图 3.16 4 种 基本 的 图 像 类 型 : 暗 图 像 、 亮 图 像 、 低 对 比 度 图 像 和 高 对 比 度 图 像 ， 以 及 与 它们 相对 应 的 直方 图 


条 件 (a) PER T(r) 为 单调 递增 函数 是 为 了 保证 输出 灰 度 值 不 少 于 相应 的 输入 值 ， 防 止 灰 度 反 变 
换 时 产生 人 为 缺陷 。 条 件 (b) 保证 输出 灰 度 的 范围 与 输入 灰 度 的 范围 相同 = 最 后 ， 条件 (a' ) 保 证 从 s 
到 > 的 反映 射 是 一 对 一 的 ， 防 止 出 现 二 义 性 。 图 3.17(a) 显示 了 满足 条 件 (a) 和 (b) 的 一 个 变换 函数 。 在 
这 里 我 们 看 到 ， 多 值 映 射 到 单 值 是 可 能 的 ， 并 且 仍 然 满 足 这 两 个 条 件 。 也 就 是 说 ， 单 调 变换 函数 执行 
一 对 一 或 多 对 一 映射 。 当 从 + 到 s 映射 时 ， 这 是 很 完美 的 。 然 而 ， 如 果 我 们 想 要 唯一 地 从 映射 的 值 恢 
复 r 值 (反映 射 由 反 向 箭头 表示 ) , 图 3.17(a) 就 存在 一 个 问题 。 图 3.17(a) P's, 的 反映 射 是 可 能 的 , ME s, 
的 反映 射 是 一 个 范围 值 , 通常 要 防止 由 so 恢 复原 始 + 值 的 问题 。 如 图 3.17(b) Bray, T(r) 要 求 是 严格 单 
调 的 ， 以 保证 反映 射 是 单 值 的 ( 即 两 个 方向 上 的 映射 都 是 一 对 一 的 ) 。 这 是 我 们 在 本 章 后 面 推导 一 些 重 
要 直方 图 处 理 技术 的 理论 要 求 。 因 为 在 实践 中 我 们 处 理 的 是 整数 灰 度 值 ， 必 须 把 所 有 结果 四 舍 五 入 为 
最 接近 的 整数 值 。 因 此 ， 不 满足 严格 单调 时 ， 我 们 就 要 使 用 寻找 最 接近 匹配 整数 的 方法 来 解决 非 唯一 
反 变 换 的 问题 。 例 3.8 对 此 给 出 了 说 明 。 
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图 3.17 (a) 非 单调 递增 函数 ， 显 示 了 将 多 个 值 映 射 为 单个 值 的 方 
式 ; (b) 严 格 单调 递增 函数 。 这 是 一 个 双向 的 一 一 映射 


一 幅 图 像 的 灰 度 级 可 视 为 区 间 [0, 民 -内 的 随机 变量 。 随 机 变量 的 基本 描绘 子 是 其 概率 密度 函数 
(PDF) . © p,(r) FI p, (s) 分 别 表示 随机 变量 x 和; 的 概率 密度 函数 , HEP p 的 下 标 用 于 指示 p, 和 p, 是 
不 同 的 函数 。 由 基本 概率 论 得 到 的 一 个 基本 结果 是 , 如果 p,(r) 和 7(-) 已 知 , 且 在 感 兴趣 的 值 域 上 7T(r) 
是 连续 且 可 微 的 ， 则 变换 (映射 ) 后 的 变量 s 的 PDF 可 由 下 面 的 简单 公式 得 到 ; 


ps(s)= p,(r) 


这 样 ， 我 们 看 到 ， 输 出 灰 度 变量 s 的 PDF 就 由 输入 灰 度 的 PDF 和 所 用 变换 函数 决定 [ 回忆 可 知 r+ 和 ;8 
H T(r) 关联 起 来 ]。 

在 图 像 处 理 中 ,特别 重要 的 变换 函数 有 如 下 形式 : 

s=T(r)=(L- vf p, (w)dw (3.3-4) 

AP, w 是 积分 的 假 变量 。 公 式 右边 是 随机 变量 > 的 累积 分 布 函数 (CDF) 。 因 为 PDF 总 为 正 ， 回 忆 可 
知 一 个 函数 的 积分 是 该 函数 下 方 的 面积 , 遵循 式 (3.3-4) 的 变换 函数 满足 条 件 (a) , 因为 函数 下 的 面积 不 
pë r 的 增 大 而 减 小 。 该 式 中 的 上 限 是 x= (L-1) 时 ,积分 值 等 于 1(PDF 曲线 下 方 的 面积 总 是 1) ， 所 以 
s 的 最 大 值 是 (L 一 1) ， 并 且 条 件 (b) 也 满足 。 

为 寻找 刚才 讨论 的 相应 变换 的 p(s) ,我们 使 用 式 (3.3-3) 。 由 基本 积分 学 中 的 莱 布 尼 区 准则 可 知 ， 
关于 上 限 的 定 积分 的 导数 是 被 积 函 数 在 该 上 限 的 值 ， 即 


ds _dT(r) 


dr dr 
JE dr / ds 的 这 个 结果 代入 式 (3.3-3) ， 并 记 住 概率 密度 值 为 正 ， 得 到 





z| (3.3-3) 
ds 





L= Sal f j p, (wdw | =(L-1)p,(r) (3.3-5) 


1 


ps(s)= p, (r) = 


0<s<L-l (3.3-6) 











|= po 
ds| Oe Lp.) 
从 该 式 最 后 一 行 中 的 p(s) 可 知 ， 这 是 一 个 均匀 概率 密度 函数 。 简 而 言 之 ， 我 们 已 证 明 执 行 式 (3.3-4) 的 灰 
度 变 换 将 得 到 一 个 随机 变量 s， 该 随机 变量 由 一 个 均匀 PDF 表征 。 特 别 注意 ， 由 该 式 可 知 7T(r) 取决 于 
1 p,(r) ,但 如 式 (3.3-6) 指 出 的 那样 , 得 到 的 p(s) 始终 是 均匀 的 , ES p, (x) 的 形式 无 关 。 图 3.18 说 明了 
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ab p,(r) ps(s) 





+ £334) 


图 3.18 ” (a) 一 个 任意 的 PDF; (b) 对 所 有 灰 度 级 7 应 用 式 (3.3-4) 中 的 变换 
的 结果 。 具 有 均匀 PDF 的 结果 灰 度 * 与 > 的 PDF 的 形式 无 关 





对 于 离散 值 ， 我 们 处 理 其 概率 (直方 图 值 ) 与 如 前 所 述 ， 
一 幅 数 字 图 像 中 灰 度 级 六 出 现 的 概率 近似 为 


Prt) = 1， 于 全 (3,3-7) 
式 中 ，MN 是 图 像 的 总 像素 ，n 是 灰 度 为 的 像素 个 数 ，L 是 图 像 中 可 能 灰 度 级 





是 256) 。 正 像 本 节 开 始 说 明 的 那样 ， 与 相对 的 p, (r) em AB. o 
sh (3.3-4) 中 变换 的 离散 形式 为 


s, =T) =(L- no- 名 ; ena. EI (3.3-8) 
=0 


jw 
一 








CO) 先前 声明 的 单调 性 条 件 同样 适用 于 离散 情形 。 我 们 简单 地 将 变量 的 值 限 制 为 离散 值 。 
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这 样 ， 已 处 理 的 图 像 ( 即 输出 图 像 ) 通 过 式 (3.3-8) 将 输入 图 像 中 灰 度 级 为 x 的 各 像素 映射 到 输出 图 像 中 
灰 度 级 为 sk 的 对 应 像素 得 到 。 在 这 个 公式 中 ， 变 换 (映射 ) T(x ) 称 为 直方 图 均衡 或 直方 图 线性 变换 。 
不 难 证 明 ( 见 习题 3.10) 该 变换 函数 满足 本 节 前 面 所 述 的 条 件 (a) AI (b) 。 


eye T 


表 3.1 64x64 像素 的 3 比特 数字 图 像 的 灰 度 分 布 和 直方 图 值 
ee Nk i 了 pkm=m/MN 


Pan 


APAE TRA A EARE E IR EVES So BRT PEA IM IRIE h, 
刚才 推导 的 方法 还 有 另 一 个 优点 ， 即 它 是 完全 “自动 的 "。 换 句 话 说， 给 定 一 幅 图 像 ， 直方 图 均衡 处 理 
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仅 涉及 执行 式 (3.3-8) ， 该 式 可 以 直接 使 用 从 已 知 图 像 提取 的 信息 ， 而 不 需要 更 多 的 参数 说 明 。 我 们 还 
注意 到 实现 该 技术 所 要 求 的 计算 很 简单 。 











apie pr Ps (Sx) 
4 
0.25 0.25 + ° pe 
0.20 0.20 十 。 ? 
0.15 0.15 + 
0.10 0.10 + ° 
0.05 POO | | | e 
oe ee E rN 
Dl i eee oe O L 2) 3) ees 7 (ht Ot Sea sy 6 97 


图 3.19 3 比特 (8 个 灰 度 级 ) 图 像 的 直方 图 均衡 示例 : (a) 原始 直方 图 ; (b) 变换 函数 ; (Co) 均衡 后 的 直方 图 
从 s 回 到 + 的 反 变 换 形式 表示 为 
(EO L] (3.3-9) 


可 以 证 明 ( 见 习题 3.10) ， 只 要 灰 度 级 六 ,大 = 0,1 2,…, 工 -1 在 输入 图 像 中 一 个 也 不 缺 ， 即 图 像 直方 图 
中 没有 哪个 分 量 为 0， 反 变换 就 满足 条 件 (a0 和 (b) 。 尽 管 反 变 换 不 用 于 直方 图 均衡 ， 但 它 在 下 一 节 研 
究 的 直方 图 匹配 方案 中 起 核心 作用 。 - 


例 3.6 直方 图 均衡 。 

图 3.20 左 边 一 列 显示 了 来 自 图 3. 16 的 sme, 
中 间 一 列 显示 了 对 每 幅 图 人 执行 直方 图 均衡 后 的 结 
果 。 从 上 到 下 的 前 三 种 结果 表明 效果 改进 明显 。 如 
预期 的 那样 , 直方 图 均衡 对 第 四 幅 图 像 未 产生 太 大 的 
效果 , 因为 这 幅 图 像 的 灰 度 已 扩展 到 了 整个 灰 度 级 范 
围 。 图 3.21 显示 了 用 于 产生 图 3.20 中 均衡 后 图 像 的 
变换 函数 :这 些 函 数 是 使 用 式 (3.3-8) 产 生 的 。 很 明显 ， 
变换 (人 的 形状 近 侯 为 线性 形状 ， 它 表明 输入 被 史册 
Joie. 6 

图 3.20 中 的 第 三 列 显示 了 均衡 后 的 图 像 的 直方 Wo J 
图 。 有趣 的 是 ， 尽 管 这 些 直方 图 不 同 ， 但 直方 图 均衡 4 ly hl 
后 的 图 像 本 身 在 视觉 上 却 非常 相似 。 这 正 是 我 们 所 希 Hist 
望 的 结果 ， 因 为 左边 一 列 图 像 之 间 的 差异 仅 是 对 比 度 
上 的 ， 而 不 是 内 容 上 的 。 换 名 话说 ， 因 为 图 像 有 相同 
的 内 容 ， 直方 图 均衡 导致 的 对 比 度 增强 足以 补偿 图 
像 在 视觉 上 难以 区 分 灰 度 级 的 差别 。 在 给 出 原始 图 : Lo 1 usis 
像 间 的 重要 对 比 度 差别 后 ， 该 例 涪 明了 直方 图 均衡 作 ae 左边 一 列 : 来 自 图 3.16 的 图 像 。 
为 自 适应 对 比 度 增强 工具 的 强大 作用 。 中 间 一 列 : 均衡 后 的 相应 图 像 。 右 


33.2 ”直方 图 匹配 (规定 化 ) 边 一 列 : 中 间 一 列 图 像 的 直方 图 


如 前 所 述 ， 直 方 图 均衡 能 自动 地 确定 变换 函数 ， 该 函数 寻求 产生 有 均匀 直方 图 的 输出 图 像 。 需 要 
自动 增强 时 ,这 是 一 种 好 方法 ， 因 为 由 这 种 技术 得 到 的 结果 可 以 预知 ， 并 且 这 种 方法 实现 起 来 








| 
Ll ili 
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也 很 简单 。 我 们 将 在 本 节 中 指出 ， 对 于 某 些 应 用 ; 采用 均匀 直方 图 的 基本 增强 并 不 是 最 好 的 方法 。 特 


别 地 ， 有 时 我 们 希望 处 理 后 的 图 像 具 有 规定 的 直方 图 形状 可 能 更 有 用 。 这 种 用 于 产生 处 理 后 有 特殊 直 
方 图 的 方法 称 为 直方 图 匹配 或 直方 图 规定 化 。 


255 


192 |= 











0 64 128 " «492 255 


图 3.21 直方 图 均衡 的 变换 函数 。 变 换 (1) 到 (4) 是 使 用 式 (3.3-8) 
由 图 3.20 左边 一 列 图 像 ( 从 上 到 下 ) 的 直方 图 得 到 的 
现在 我 们 暂时 回 到 连续 灰 度 + 和 z( 视 为 连续 随机 变量 ) ， 并 令 p,(r) 和 p.(z) 表示 它们 所 对 应 的 连 
续 概 率 密度 函数 。 在 这 种 表示 法 中 , > 和 = 分别 表示 输入 图 像 和 输出 (已 处 理 ) 图 像 的 灰 度 级 。 我们 可 以 
由 给 定 的 输入 图 像 估 计 p,(r) ， 而 p.(z) 是 我 们 希望 输出 图 像 所 具有 的 指定 概率 密度 函数 。 
令 s 是 一 个 具有 如 下 特性 的 随机 变量 ; 


s=T(r)=(L STN p,(w)dw * (3,3-10) 


AF, 如 前 面 一 样 ,，w 为 积分 假 变量 。 我 们 发 现 这 个 表达 式 是 式 (3.3-4) 给 出 的 直方 图 均衡 的 连续 形式 。 
接着 ， 我 们 定义 一 个 具有 如 下 特性 的 随机 变量 z: 


G(z)=(L- vf p.(t)dt =s (3.3-11) 
式 中 ，t 为 积分 假 变量 。 由 这 两 个 等 式 可 得 G(z) =T(r), A z 必须 满足 下 列 条 件 : 
z=G[T(r)]=G\(s) (3.3-12) 


一 旦 由 输入 图 像 估计 出 p (r), ZRT) 就 可 由 式 (3.3-10) 得 到 。 类 似 地 ， 因 为 p.(z) 已 知 ， 变换 
PR G(z) 可 由 式 (3.3-11) 得 到 。 

式 (3.3-10) 到 式 (3.3-12) 表 明 , 使 用 下 列 步骤 ， 可 由 一 幅 给 定 图 像 得 到 一 幅 其 灰 度 级 具有 指定 概率 
密度 函数 的 图 像 : 


1. 由 输入 图 像 得 到 p, (x) ， 并 由 式 (3.3-10) 求 得 s 的 值 。 

2. 使 用 式 (3.3-11) 中 指定 的 PDF 求 得 变换 函数 G(z) 。 

3. 求 得 反 变换 函数 z = G(s) ; 因为 z 是 由 s 得 到 的 ， 所 以 该 处 理 是 s 到 z 的 映射 ， 而 后 者 正 是 
我 们 期 望 的 值 。 

4. 首先 用 式 (3.3-10) 对 输入 图 像 进 行 均衡 得 到 输出 图 像 ; 该 图 像 的 像素 值 是 * 值 。 对 均衡 后 的 图 
像 中 具有 s 值 的 每 个 像素 执行 反映 射 z= G™"(s) ， 得 到 输出 图 像 中 的 相应 像素 。 当 所 有 像素 都 
处 理 完 后 ， 输 出 图 像 的 PDF 将 等 于 指定 的 PDF。 
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例 3.7 直方 图 规定 化 。 
假设 采用 连续 灰 度 值 ， 并 假设 一 幅 图 像 的 灰 度 PDF 为 p(n)= FL- , 0srs C-D), 对 于 其 他 
r 值 有 p,(r)=0。 寻找 一 个 变换 函数 ， (eye HARE IE PDF 是 POA NL- , 0<z<(L~l), 
而 对 于 其 他 z 值 月 p,(2)=06。 ~ 
首先 ， 我 们 对 区 间 [0,5-]] ee I 
: : r? 
及 二 了 (r)= te “nf, podw- sf a ieee “GoD D | 
由 定义 可 知 ， 对 于 范围 [0， L-1) 外 的 值 ， 该 变换 为 0。 输入 灰 度 值 的 平方 除 以 (一 了 将 产生 一 幅 灰 度 为 
并 具有 均匀 PDF 的 图 像 ， 因 为 这 是 早 些 时 候 讨论 的 直方 图 均衡 变换 。 
我 们 感 兴趣 的 是 具有 规定 直方 图 的 图 像 ， 因此 我 们 在 [0， L 区 间 寻 找 下 一 个 直方 图 均衡 变换 : 
z 3 
G(z)=(L- vf piwe al: w Hogy 
由 定义 可 知 在 该 区 间 外 该 函数 也 为 0 最 后 ,我 们 要 求 G(z) = s M4 G(z)=23/(L-1)° ;因此 2/(C-D2=s， 
并 且 有 | 
TE pg” ia 
WRH (L 1)? 乘 以 直方 图 均衡 过 的 每 个 像素 ， 取 该 乘积 的 18 次 方 ， 结果 将 是 由 我 们 所 期 记 的 图 像 ， 该 
图 像 在 区 间 [0,- 中 内 z 的 灰 度 的 PDE H p;(2)= sar HE a. 
因为 s= AL 一 1) ， 我 们 可 DLAC APRA AE 


z= ee D a Jey ee -E a Dr ge 


这 样 ， 原 图 像 中 每 个 像素 值 的 平方 与 (L-1) H, 然后 再 取 该 乘积 的 ， 13 次 方 ,将 得 到 其 灰 度 级 z 具有 规 
定 PDF 的 图 像 ,我们 看 到 ， 均衡 输入 图 像 的 中 间 一 步 可 以 跳 过 ; REEERE 的 变换 函数 T(x) 。 
然后 ， 这 两 步 可 以 合并 为 从 + 到 z 的 一 步 变 换 。 


正如 前 面 的 例子 所 示 ， 直 方 图 规定 化 在 原理 上 很 简单 。 在 实践 中 ,常见 的 困难 是 寻找 T(r) 和 G™ 
的 有 意义 表达 式 。 所 幸 的 是 , 在 处 理 离散 量 时 ,问题 可 大 大 简化 。 这 里 仅 希 望 得 到 一 个 近似 的 直方 图 ， 
所 以 付出 的 代价 与 直方 图 均衡 一 样 。 然 而 ， 不 管 如 何 ， 我 们 都 可 以 得 到 一 些 非常 有 用 的 结果 ， 尽 管 结 
果 是 粗糙 的 近似 。 

zh (3.3-10) 的 离散 形式 是 式 (3.3-8) 中 的 直方 图 均衡 变换 ， 为 方便 起 见 ， 我 们 重 写 如 下 : 








k k 
=7(7,)=(L-D> pr, =n, k =0,1,2,--+,L-1 (3.3-13) 
i=0 MN j=0 


与 前 面 一 样 , 式 中 MN 是 图 像 的 像素 总 数 ，nj 是 具有 灰 度 值 7 的 像素 数 , 工 是 图 像 中 可 能 的 灰 度 级 数 。 
类 似 地 ， 给 出 一 个 规定 的 总 值 ， 式 (3.3-11) 的 离散 形式 涉及 计算 变换 函数 
G(z,)=(L- yy p.(z;) (3.3-14) 
i=0 


— qi, A 
G(z,)=5, (3,3-15) 


153 


154 
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式 中 ，p,(z;) 是 规定 直方 图 的 第 i 个 值 。 与 前 面 一 样 ， 我 们 用 反 变换 找到 期 望 的 值 z,: 
z, =G"'(s,) (3.3-16) 

换 句 话说 ， 该 操作 对 每 个 值 给 出 一 个 z 值 ; 这 样 ， 就 形成 了 从 到 = 的 一 个 映射 。 

实践 中 ， 我 们 不 需要 计算 G 的 反 变换 :因为 我 们 处 理 的 灰 度 级 是 整数 (如 8 比特 图 像 的 灰 度 级 是 
从 0 到 255), (FASE (3.3-14) 计算 9 = 0,1 2,…, 工 -1 时 的 所 有 可 能 G 值 很 简单 。 标 定 这 些 值 ， 并 四 合 
RAAB IA (0, L-1] 内 的 最 接近 整数 。 将 这 些 值 存储 在 一 个 表 中 。 给 定 一 个 特殊 的 5 值 后 ， 我 们 可 以 
查找 存储 在 表 中 的 最 匹配 的 值 。 例 如 ， 如 果 在 表 中 第 64 个 输入 接近 s, ， 则 g = 63 (注意 ,我 们 是 从 0 
开始 计数 的 ) ， 故 zs 是 式 (3.3-15) 的 最 优 解 。 这 样 ， 给 定 的 5s, 值 就 与 zs 关联 在 一 起 ( 即 规定 的 w% 值 将 
映射 为 zs ) 。 因 为 z 项 是 规定 直方 图 p, (z) 所 用 的 灰 度 , WAL zy =0,z =1,…,zz.1 = 上 -1, BIE, ze 的 
灰 度 值 为 63。 重 复 该 过 程 ， 我 们 可 找到 每 个 s; 值 到 2, 值 的 映射 ， 它们 是 式 (3.3-15) 的 最 接近 的 解 。 这 
些 映射 也 是 直方 图 规定 化 问题 的 解 。 

EHZ s, 是 直方 图 均衡 后 的 图 像 的 值 ， 我 们 可 以 总 结 直方 图 规定 化 过 程 如 下 : 


1. 计算 给 定 图 像 的 直方 图 p,(r) ， 并 用 它 寻 找 式 (3.3-13) 的 直方 图 均衡 变换 。 把 % 四 舍 五 和 为 范 
Fé] (0, L -1] AAR. 

2. 用 式 (3.3-14) 对 gq = 0,1, 2,…, 工 -1 计算 变换 函数 G 的 所 有 值 ， 其 中 p,(z,) 是 规定 直方 图 的 值 。 
把 G 的 值 四 舍 五 人 为 范围 [0, 工 -1 内 的 整数 。 将 G 的 值 存储 在 一 个 表 中 。 

3. 对 每 个 值 s ,k=0,1,2,---,L—1 , 使 用 步骤 2 存储 的 G 值 寻找 相应 的 z 值 , 以 使 G(z, ) 最 接近 sw ， 
并 存储 这 些 从 s 到 z 的 映射 。 当 满足 给 定 5, 的 z, 值 多 于 一 个 时 ( 即 映射 不 唯一 时 ) ， 按 惯例 选 
择 最 小 的 值 。 

4. 先 对 输入 图 像 进行 均衡 ， 然 后 使 用 步骤 3 找到 的 映射 把 该 图 像 中 每 个 均衡 后 的 像素 值 s; 映射 
为 直方 图 规定 化 后 的 图 像 中 的 相应 z 值 ， 形 成 直方 图 规定 化 后 的 图 像 。 如 连续 情况 那样 ， 均 
衡 输 入 图 像 的 中 间 步 又 是 概念 上 的 ,合并 两 个 变换 函数 TT 和 G7 可 跳 过 这 一 步 , 如 例 3.8 所 示 。 


如 前 面 提 到 的 那样 ， 对 于 满足 条 件 (a' ) 和 (b) 的 G”，G 必须 是 严格 单调 的 ,根据 式 (3.3-14) , È 
意味 着 规定 直方 图 的 任何 p, (z,) 值 都 不 能 为 零 (见习 题 3.10) 。 当 工作 在 离散 数值 的 情况 时 ， 该 条 件 可 
能 不 满足 的 事实 并 不 是 一 个 严重 的 实现 问题 ， 如 上 面 的 步骤 3 中 指出 的 那样 。 下 面 的 例子 用 数字 说 明 
了 这 一 情况 。 


例 3.8 直方 图 规定 化 的 一 个 简单 例子 。 cE 
再 次 考虑 例 35 中 大 小 为 64x 64 的 假设 图 像 其 直方 图 重复 显示 在 图 322 人 P umni 
具有 表 32 中 第 二 列 规定 的 值 。 图 3.22 (pb) 显示 了 该 直方 图 的 大 要 形状 





表 3.2 规定 直方 图 和 实际 直方 图 (第 三 列 的 值 来 自 例 3.8 中 的 计算 结果 ) 


Za 规定 的 pz (Za) 实际 的 pz (Z,) 
z0=0 0.00 0.00 
z=1 0.00 0.00 
z=2 0.00 0.00 
z3=3 0.15 0.19 
z4=4 0.20 0.25 
zs=5 0.30 021 
26=6 0.20 l 0.24 
27=7 0.15 0.11 
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tt mids 6 
图 3.22”(a) 一 幅 3 比特 图 像 的 直方 图 ; (b) 规定 的 直方 图 ; (c) 从 规定 的 直方 图 
得 到 的 变换 函数 ; (d) 执行 直方 图 规定 化 的 结果 。 请 比较 图 (b) 和 图 (d) 
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R33 ”变换 函数 G 关于 Zz 的 所 有 表 3.4 将 所 有 的 sk 值 映 射 到 相应 的 zo 值 
可 能 值 ( 已 四 舍 五 入 并 排序 ) — mM 
nn Sk ig Z4 
Zy G (Z4) 
2=0 0 i > 
=i 0 3 => 4 
=2 0 5 i 5 
z=3 1 6 iji 6 
z4=4 2 Fi i 7 
=5 5 
6=6 6 
Fa 7 7 


在 过 程 的 最 后 一 步 中 ， 我 们 使 用 表 3.4 中 的 映射 把 直方 图 均衡 后 的 图 像 中 的 每 个 像素 ， 映 射 为 新 创建 
的 直方 图 规定 化 图 像 中 的 相应 像素 。 结果 直方 图 的 值 列 在 表 3.2 的 第 三 列 , 直方 图 画 在 图 3.22(d) P. p(z) 
的 值 是 使 用 例 3.5 中 的 相同 过 程 得 到 的 。 例如， 我们 在 表 3.4 中 看 到 ，s = 1 喘 射 为 z==3， 在 直方 图 均衡 后 
的 图 像 中 有 790 个 像素 取 1 值 。 因此，p,(z3)=790/14096=0.19 。 

虽然 示 于 图 3.22 (d) 中 的 最 终结 果 并 不 完全 与 规定 的 直方 图 匹配 ,但 我 们 达到 了 将 灰 度 明确 地 移 向 灰 度 
级 高 端的 目的 。 如 前 面 提 到 的 那样 ， 得 到 直方 图 均衡 后 图 像 的 中 间 步 又 对 于 解释 该 过 程 是 有 帮助 的 ， 但 它 
并 不 是 必需 的 。 相 反 ， 我 们 可 以 在 表 中 的 第 三 列 列 出 从 7 到 * 的 映射 和 从 到 z 的 映射 。 然 后 ， 使 用 这 些 
映射 把 原始 像素 直接 映射 到 直方 图 规定 化 后 的 图 像 的 像素 。 


例 3.9 直方 图 均衡 与 直方 图 匹配 的 比较 。 

图 3.23 (a) 显示 了 火 卫 一 的 图 像 , 该 图 像 由 NASA 的 火星 表面 探测 器 拍摄 。 图 3.23 (b) 显示 了 图 3.23 (a) 
的 直方 图 。 图像 的 大 部 分 是 暗色 区 域 ， 产生 了 像素 集中 于 灰 度 级 暗 端的 直方 图 的 特点 。 车 看 之 下 ,会 得 到 
直方 图 均衡 化 是 增强 该 图 像 的 一 个 好 办 法 的 结论 ， 以 便 使 暗 区 域 的 细节 更 清楚 。 下 面 的 讨论 将 证 明 事实 并 
非 如 此 。 





像素 数 (X109 











o We i 
0 64 128 192 255 





图 3.23 (a) H NASA 的 火星 表面 探测 器 拍摄 的 火 卫 一 图 像 ;(b) 直方 图 ( 原 图 像 由 NASA 提供 ) 


图 3.24 (a) 显示 了 由 图 3.23 (b) 所 示 直方 图 得 到 的 直方 图 均衡 变换 [ 式 (3.3-8) 或 式 (3.3-13) ] 。 这 个 变换 
函数 最 相关 的 特征 是 ， 它 从 灰 度 0 快速 上 升 到 接近 190。 这 是 因为 输入 直方 图 中 有 大 量 的 像素 灰 度 接近 0。 
当 这 种 变换 应 用 于 输入 图 像 的 灰 度 ， 以 获得 直方 图 的 均衡 效果 时 ， 最 终结 果 是 把 非常 罕 的 暗 像素 区 间 映 射 
到 输出 图 像 灰 度 级 的 高 端 。 因 为 输入 图 像 的 大 量 像素 在 此 区 间 有 精确 的 灰 度 值 ， 所 以 我 们 希望 结果 是 具有 
明亮 旦 “冲淡 ”外 观 的 图 像 。 如 图 3.24 (b) 所 示 ， 情 况 确实 如 此 。 该 图 像 的 直方 图 示 于 图 3.24(c) 。 注 意 ， 
所 有 灰 度 级 基本 上 都 偏向 了 灰 度 范围 的 上 半 部 。 
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像素 数 ( x 104) 





图 3.24 (a) 直方 图 均衡 的 变换 函数 ; (b) 直方 图 均衡 后 的 图 像 ( 注 意 “ 冲 淡 ” 的 外 观 ) ; (c) 图 (b) 的 直方 图 






l om 3240) cro 
直方 图 规定 化 依 的 改进 是 


到 目前 为 止 ， 虽然 我 们 对 直方 图 规定 化 已 经 很 清 起 但 在 结束 这 _ 节 之 前 ， 我 人 要 强调 直方 图 规 
定 化 在 大 多 数 时 候 都 是 试 凑 过 程 。 正 像 前 边 的 例子 中 我 们 所 做 的 那样 ， 有 用 的 指导 方式 是 得 用 手边 的 
问题 进行 学 习 。 但 是 ， 有 时 可 能 会 遇 到 这 样 的 情况 ， 即 定义 “平均 ”直方 图 的 外 观 ， 并 把 它 作为 规定 
的 直方 图 。 在 这 种 情况 下 ， 直 方 图 规定 化 就 变 成 了 一 种 直接 的 处 理 。 然 而 ,一般 来 说 ， 并 没有 规定 直 
方 图 的 规则 ， 对 于 任何 给 定 的 增强 任务 都 必须 借助 于 实际 分 析 。 


3.3.3 ”局 部 直方 图 处 理 


前 两 节 讨 论 的 直方 图 处 理 方法 是 全 局 性 的 , 在 某 种 意义 上 , 像素 被 基于 整 幅 图 像 的 灰 度 分 布 的 变换 
函数 修改 。 虽 然 这 种 全 局 方法 适用 于 整个 图 像 的 增强 , 但 存在 增强 图 像 中 小 区 域 的 细节 的 需要 。 在 这 些 
区 域 中 ， 一 些 像素 的 影响 在 全 局 变换 的 计算 中 可 能 被 忽略 ， 因 为 全 局 变换 没有 必要 保证 期 望 的 局 部 增 
强 。 解 决 方法 是 以 图 像 中 每 个 像素 的 邻 域 中 的 灰 度 分 布 为 基础 设计 变换 函数 。 
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0 图 3.25 (a) 规定 的 直方 图 ; (b) 变换 ; 
7.00 ~ | 一 增强 图 像 ，(d) 图 (c) 的 直方 图 
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0 64 128 192 255 
IRE 

前 面 描述 的 直方 图 处 理 技术 很 容易 用 于 局 部 增强 。 过 程 是 定义 一 个 邻 域 ， 并 把 该 区 域 的 中 心 从 一 
个 像素 移 至 另 一 个 像素 。 在 每 个 位 置 ， 计 算 邻 域 中 的 点 的 直方 图 ， 并 且 得 到 的 不 是 直方 图 均衡 化 ， 就 
是 规定 化 变换 函数 。 这 个 函数 最 终 用 于 映射 邻 域 中 心 像素 的 灰 度 。 然 后 ， 邻 域 的 中 心 被 移 至 一 个 相 邻 
像素 位 置 ， 并 重复 该 过 程 。 对 邻 域 进行 逐 像素 平移 时 ， 由 于 只 有 邻 域 中 的 一 行 或 一 列 改变 ， 所 以 可 在 
每 一 步 移动 中 ， 以 新 数据 更 新 前 一 位 置 得 到 的 直方 图 (见习 题 3.12) 。 这 种 方法 与 区 域 每 移动 一 个 像素 
位 置 就 计算 邻 域 中 所 有 像素 的 直方 图 相 比 优点 明显 。 有 时 用 于 减少 计算 量 的 另 一 种 方法 是 ， 使 用 非 重 
AKR, 但 这 种 方法 通常 会 产生 我 们 不 希望 的 “棋盘 ”效应 。 


例 3.10 ， 局 部 直方 图 均衡 。 | 









so LLET emeren ro 
下 方 方 块 中 包含 有 一 个 物体 。 图 3.26 (c) 是 使 用 大 小 为 3x3 
全 在 暗色 方块 中 的 物体 。 这 些 物体 的 灰 度 信 太 接近 


ASAE, TEENA, | 不 足以 影响 这 些 细节 的 显示 。 
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图 3.26 (a) 原 图 像 ;，(b) 全 局 直方 图 均衡 的 结果 ; (c) 使 用 大 
小 为 3x3 的 邻 域 对 图 (a) 应 用 局 部 直方 图 均衡 的 结果 


3.3.4 在 图 像 增强 中 使 用 直方 图 统计 


直接 从 直方 图 获得 的 统计 参数 可 用 于 图 像 增 强 。 令 r 表示 在 区 间 [0, 工 -世上 代表 灰 度 值 的 一 个 离 
散 随 机 变量 , HS p(x;) 表示 对 应 于 7 值 的 归 一 化 直方 图 分 量 。 如 前 面 指出 的 那样 , 我 们 可 以 把 p(7;) 视 
为 得 到 直方 图 的 那 幅 图 像 的 灰 度 导出 现 的 概率 估计 。 

像 2.6.8 节 讨 论 的 那样 ，r 关 于 其 均值 的 n 阶 矩 定义 为 


L-1 
u, (r) = J (r; -m})" py) (3.3-17) 
i=0 
式 中 ,，m 是 + 的 均值 (平均 灰 度 ， 即 图 像 中 像素 的 平均 灰 度 ) : 我 们 遵守 使 用 m 来 表示 均 什 的 约 
J 定 。 请 不 要 将 它 与 用 于 表示 一 个 大 小 
m=) rp(r) (3.3-18) H mxn 的 邻 域 的 行 数 的 相同 符号 泥 


i=0 淆 ， 因 为 在 表示 邻 域 的 行 数 时 ,我们 
也 遵守 了 符号 表示 约定 。 





二 阶 和 矩 特别 重要 : 


B= etn) (3.3-19) 
i=0 
我 们 将 该 表达 式 称 为 灰 度 方差 , 通常 用 o? 表示 (回忆 可 知 标准 差 是 方差 的 平方 根 ) o 均值 是 平均 灰 度 的 
度量 , 方差 (或 标准 差 ) 是 图 像 对 比 度 的 度量 。 显 然 ， 一 旦 从 给 定 的 图 像 得 到 直方 图 ， 用 前 面 的 表达 式 
就 很 容易 计算 所 有 的 矩 。 
在 仅 处 理 均值 和 方差 时 ， 实 际 上 通常 直接 从 取样 值 来 估计 它们 ， 而 不 必 计 算 直 方 图 。 近 似 地 ， 这 
些 估计 称 为 取样 均值 和 取样 方差 。 根 据 基本 的 统计 学 ， 它 们 可 由 下 面 熟悉 的 形式 给 出 ; 


(3.3-20) 
m = -一 -一 T(x, y) 3.3-20 
MN x=0 y=0 
和 式 33.21) 中 的 分 母 有 时 写 为 
MN MN -1 而 非 MN, 目的 是 获得 方差 
Or eee [ f(x,y) —m] (3.3-21) | 的 无 偏 估计 。 但 我 们 对 式 (3.3.21) 
MN ye Ast (3.3+19) [ 在 后 一 公式 中 的 直 


=f 方 图 是 由 式 (3.3-21) 使 用 的 同一 幅 
IP, x=0,1,2,---,M-1, y=0;1,2,… ,NN 一 1。 换 句 话 说 , 众所周知， | 图 像 计 算得 到 的 时 ] 一 致 更 感 兴 


一 幅 图 像 的 平均 灰 度 可 以 通过 求 所 有 像素 的 灰 度 值 之 和 并 用 图 像 中 “| 趣 。 因 此 , 我 们 要求 MN 项 。 对 于 
的 像素 总 数 去 除 得 到 。 类 似 的 解释 适用 于 式 (3.3-21) 。 如 下 面 的 例子 sg 
所 示 , 使 用 这 两 个 公式 得 到 的 结果 等 同 于 使 用 式 (3.3-18) 和 式 (3.3-19) 
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得 到 的 结果 , 前 提 是 这 些 公 \ 式 中 使 用 的 直方 图 是 由 式 G. 3-20) 和 式 (3. pen 中 使 用 的 同一 幅 图 像 计 算 
得 到 的 。 


os 
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我 们 考虑 均值 和 方差 的 两 种 增强 应 用 。 全 局 均值 和 方差 是 在 整 幅 图 像 上 计算 的 ， 这 对 于 灰 度 和 对 
比 度 的 总 体 调 整 是 有 用 的 。 这 些 参数 的 一 种 更 有 效 的 应 用 是 局 部 增强 ， ney: 局 部 均值 和 方 
差 是 根据 图 像 中 每 个 像素 的 邻 域内 的 图 像 特征 进行 改变 的 基础 。 

S (x, y) 表示 给 定 图 像 中 任意 像素 的 坐标 ，S,, 表示 规定 大 小 的 以 (x,y) 为 中 心 的 邻 域 ( 子 图 像 ) 。 
该 邻 域 中 像素 的 均值 由 下 式 给 出 : 


L-1 
ms, =} nps, (7) (3.3-22) 
i=0 


RP, py 是 区 域 S。 中 像素 的 直方 图 。 该 直方 图 有 工 个 分 量 ， 对 应 于 输入 图 像 中 工 个 可 能 的 灰 度 值 。 
然而 ,许多 分 量 是 0， 具体 取决 于 5, 的 大 小 。 例 如 ， 如 果 邻 域 大 小 为 3x3 AL = 256， 那 么 该 邻 域 的 
直方 图 的 256 个 分 量 中 仅 1 和 9 之 间 的 分 量 非 零 。 这 些 非 零 值 对 应 8。 中 的 不 同 灰 度数 (在 3x3 区 域 中 
可 能 的 不 同 灰 度 的 最 天数 是 9， 最 小 数 是 1) 。 

类 似 地 ， Di 


o, Lge- ms, y Ps, (r) - (3 .3-23) 





a 和 前 面 一 样 ， 局 部 均值 是 名 域 5。 Ce ee ye 
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量 。 对 邻 域 ， 我们 可 写 出 类 似 于 式 (3.3-20) 和 式 (3.3-21) 的 表达 式 ， 即 简单 地 对 邻 域 中 的 像素 值 求 和 ， 


并 除 以 邻 域 中 的 像素 数 。 
正如 下 面 的 例子 说 明 的 那样 , 使 用 局 部 均值 和 方差 进行 图 像 处 理 的 一 个 重要 方面 是 其 灵活 性 , 它们 提 
供 了 简单 而 强 有 力 的 基于 统计 度量 的 增强 技术 ， 而 统计 度量 与 图 像 的 外 观 有 紧密 的 、 可 预测 的 关系 。 


例 3.12 使 用 直方 图 统计 的 局 部 增强 。 

图 3.27 (a) 显示 了 一 根 绕 在 支架 上 的 钨 丝 的 SEM (扫描 电子 显微镜 ) 图 像 。 图 像 中 央 的 钨 丝 及 其 支 
架 很 清楚 并 很 容易 分 析 。 在 图 像 的 右 侧 即 图 像 的 暗 侧 ， 有 另 一 根 钨 丝 的 结构 ， 但 几乎 看 不 到 ， 其 大 小 
和 特征 当然 也 不 容易 辨认 。 通 过 对 比 度 操作 进行 局 部 增强 ， 是 解决 这 种 图 像 中 包含 部 分 隐 含 特征 问题 
的 理想 方法 。 








<< n N= 
= = 


图 3.27 (a) 放 大 了 约 130 倍 的 钨 丝 的 SME Rik; (b) 全 局 直方 图 均衡 的 结果 ; (0) 使 用 局 部 直 
方 图 统计 增强 后 的 图 像 ( 原 图 像 由 俄 勒 四 大 学 地 质 科学 系 的 Michael Shaffer 先生 提供 ) 


在 这 种 特殊 情况 中 ,问题 是 增强 暗色 区 域 ; 但 同时 尽 可 能 使 明亮 区 域 不 变 ， 因 为 明亮 区 域 并 不 需要 增 
强 : 我 们 可 以 使 用 本 节 介 绍 的 概念 来 阐明 一 种 增强 方法 ; 这 种 方法 能 分 辩 暗 区 域 与 亮 区 域 的 不 同 ， 同 时 只 
增强 暗 区 域 。 判断 一 个 区 域 在 点 C 芒 是 瞳 还 是 亮 的 方法 是 , 把 局 部 平均 灰 度 加 。 与 表示 为 me 并 称 之 为 全 
局 均值 的 平均 图 像 灰 度 进行 比较 。 这 种 量 可 使 用 整个 图 像 并 用 式 (3.3-18) 或 式 (3.3-20) 得 到 。 这样 , 我 们 就 
有 了 增强 方案 的 基础 : MR m, < kome ， 其 中 局 是 一 个 值 小 于 1.0 的 正常 数 ， 那 么 我 们 将 把 点 (xy) 处 的 
像素 考虑 为 处 理 的 候选 点 。 

因为 我 们 感 兴 趣 的 是 增强 低 对比 度 的 区 域 , 所 以 还 需要 一 种 度量 方法 来 确定 一 个 区 域 的 对 比 度 是 否 可 
作为 增强 的 候选 点 -因此 , 若 as < kog , 则 认为 点 (x,y) 处 的 像素 是 增强 的 候选 点 , 其 中 ag 是 由 式 (3.3-19) 
或 式 (3.3-21) 得 到 的 全 局 标准 差 ， 妃 为 正常 数 。 若 我 们 的 兴趣 是 增强 亮 区 域 ， 则 该 常数 大 于 1.0， 对 于 暗 
区 ， 则 小 于 1.0。 

最 后 , 我 们 需要 限制 能 够 接受 的 最 低 对 比 度 值 , 否则 该 过 程 会 试图 增强 标准 差 为 零 的 恒定 区 域 。 因此 ， 
我 们 通过 要 求 有 oc < os ,< 名， 对 局 部 标准 差 设 置 一 个 较 低 的 限制 值 。 满 足 局 部 增强 所 有 条 件 的 一 个 
位 于 点 (x,y) 处 的 像素 ， 可 简单 地 通过 将 像素 值 乘 以 一 个 指定 常数 巨 来 处 理 ， 以 便 相 对 于 图 像 的 其 他 部 分 
增 大 (或 碱 小 ) 其 灰 度 值 。 不 满足 增强 条 件 的 像素 则 保持 不 变 。 

以 上 增强 方法 可 总 结 如 下 : 令 f(x,y) 表示 在 图 像 任 意 华 标 (x,y) 处 的 像素 值 , 而 令 g(x,y) 表示 这 些 坐 
标 处 相应 的 增强 的 像素 值 ， 则 对 于 x=0;1,2,…, M 一 ly=0,1,2,…,N-1,， 有 


= abe 


E- f(x,y), ms < kome Hhioos as < kog 
f Œy), 其 他 

ch, MATTE, E, koski Ak, EMER, m 是 输入 图 像 的 全 局 均值 ; ce 是 输入 图 像 的 标准 差 。 参 
数 ms Mos, 分 别 是 局 部 均值 和 标准 差 。 按 惯例 ，M 入 是 图 像 的 行 数 和 列 数 。 


g(x,y) -| (3.3-24) 


= 
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通常 ， 式 (3.3-24) 中 的 选择 参数 需要 做 一 些 试验 ， 以 便 熟 悉 一 幅 给 定 的 图 像 或 一 类 图 像 在 这 种 情况 
下 ， 常 选择 下 列 数值 : E=4.0, ky =0.4,k = oori = 0.4 。 之 所 以 对 E 选择 相对 较 

于 当 巨 与 将 被 增强 区 域 (暗色 区 域 ) 中 的 灰 度 相 采 ha oe oie AE 
衡 。 选择 的 值 比 全 局 均值 的 一 半 略 小 , 因为 我 们 观 
局 平均 值 的 一 半 还 要 瞳 。 类 似 的 分 析 可 指导 万 石和 为 值 的 选择 。 br 数 的 选 

的 选择 必须 以 对 具体 增强 问题 的 还 辑 分 析 为 指导 。 最 后 ， 为 保留 细节 和 尽 RHI 

的 大 小 应 尽 可 能 小 。 因 此 ， 我 们 选择 大 小 为 3x3 的 小 区 域 。 mae 

(IRR, RATES AR. TT 

进 , 但 分 辨 细节 还 是 很 困难 , 亮 区 域 

的 局 部 统计 方法 处 理 的 结果 。 该 图 像 与 图 3.2 
我 们 注意 到 ,图 3.27 (6) 的 右边 显示 出 了 明显 的 细节 WAC verte lope 
意 的 是 ， 左 侧 的 亮 灰 度 区 域 被 完整 地 保留 ， 而 这 正 是 我 们 的 初始 目的 之 一 。 


3.4 空间 滤波 基础 


本 节 介 绍 空间 滤波 图 像 处 理 的 几 个 基本 概念 。 空 间 滤波 是 图 像 处 理 领域 应 用 广泛 的 主要 工具 之 
一 。 因此， 我 们 应 充分 理解 这 些 基本 概念 。 正 如 本 章 开始 时 提 到 的 那样 ， 本 节 的 例子 多 数 涉及 使 用 空 

间 滤 波 来 增强 图 像 。 空 间 滤 波 的 其 他 应 用 将 在 后 面 几 章 中 讨论 。 

滤波 一 词 借用 于 频率 域 处 理 , 频率 域 处 理 是 下 一 章 的 主题 , 在 下 一 章 中 ,滤波 ”是 指 接受 (通过 ) 
或 拒绝 一 定 的 频率 成 分 ,例如 ,通过 低频 的 滤波 器 称 为 低 通 滤波 器 。 低 通 滤波 句 的 最 终 效 果 是 模糊 ( 平 
滑 ) 一 幅 图 像 。 我 们 可 以 用 空间 滤波 器 (也 称 为 空间 掩 模 、 核 、 模 板 和 
窗口 ) 直 接 作 用 于 图 像 本 身 而 完成 类 似 的 平滑 。 事 实 上 , 如 第 4 章 所 示 ， 
线性 空间 滤波 与 频率 域 滤波 之 间 存 在 一 一 对 应 关系 。 然 而 ， 空 间 滤 波 可 提供 相当 多 的 功能 ， 就 像 我 们 
稍 后 将 要 看 到 的 那样 ， 它 们 还 可 用 于 非 线性 滤波 ， 而 这 在 频率 域 中 是 做 不 到 的 。 


3.4.1 空间 滤波 机 理 


在 图 3.1 中 ， 我 们 简单 解释 过 ， 空 间 滤波 器 由 (1D) 一 个 邻 域 ( 通 常 是 一 个 较 小 的 矩形 ) ，(2) 对 该 邻 
域 所 包围 图 像 像素 执行 的 预定 义 操作 组 成 。 滤波 产生 一 个 新 像素 , 新 像素 的 坐标 等 于 邻 域 中 心 的 坐标 ， 
像素 的 值 是 滤波 操作 的 结果 ”。 滤波 器 的 中 心 访问 输入 图 像 中 的 每 个 像素 后 , 就 生成 了 处 理 (滤波 ) 后 的 
图 像 。 如 果 在 图 像 像素 上 执行 的 是 线性 操作 ， 则 该 滤波 器 称 为 线性 空间 小 波 器 。 否 则 ， 滤 波 器 就 称 
为 非 线性 空间 滤波 器 。 首 先 , 我 们 重点 关注 线性 滤波 器 ,然后 说 明 某 些 简单 的 非 线性 滤波 器 。5.3 节 
将 包含 更 多 关于 非 线性 滤波 器 及 其 应 用 的 内 容 。 

图 3.28 说 明了 使 用 3x3 邻 域 的 线性 空间 滤波 的 机 理 。 在 图 像 中 的 任意 一 点 (x,y) ， 滤 波 需 的 响应 
g(x, y) 是 滤波 器 系数 与 由 该 滤波 器 所 包围 的 图 像 像 素 的 乘积 之 和 : 


g(x,y) "= w(—1,-1) f(x-1, y—1)+ w(—1,0)f (x-1, y) +--+ + w(0,0) f(x, y)+ -+ WO Df (x+1, y +1) 


很 明显 ， 滤 波 器 的 中 心 系 数 w(0, 0) 对 准 位 置 (x,y) 的 像素 。 对 于 大 小 为 mxn 的 模板 ,我 们 假设 
m=2a+1 且 n=2b+1， 其 中 a, 5 为 正 整 数 。 这 意味 着 在 后 续 的 讨论 中 ,我 们 关注 的 是 奇数 尺寸 的 滤 





















167 滤波 后 的 像素 值 通常 会 赋 给 新 创建 图 像 中 的 对 应 位 置 ， 以 容纳 滤波 的 结果 。 滤 波 后 的 像素 代替 原 图 像 中 对 应 位 置 的 值 的 情形 很 
少见 ， 因 为 这 会 在 改变 图 像 内 容 的 同时 执行 滤波 操作 。 
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波 器 , 其 最 小 尺寸 为 3x3 。 一 般 来 说 , 使 用 大 小 为 mxn 的 滤波 器 对 大 


小 为 M x N 的 图 像 进行 线性 空间 滤波 ， 可 由 下 式 表示 : 当然, 也 可 以 使 用 偶数 尺寸 的 滤波 
aiii: Mase Ae PS 器 ,或 使 用 混合 有 偶数 尺寸 和 奇数 尺 





gt 寸 的 滤波 器 。 但 是 ， 使 用 奇数 尺寸 的 
g(x,y) = pi p w(s,t)f (x +s, y +t) 滤波 器 可 简化 索引 ， 并 更 为 直观 ， 因 
s=-at=-b 为 滤波 器 的 中 心 落 在 整数 值 上 。 
式 中 , x 和 yy 是 可 变 的 ， 以 便 w 中 的 每 个 像素 可 访问 了 中 的 每 个 像素 。 
图像 原点 

















ee 
fle = Ly 1) By EY) If a 滤波 器 系数 
fæ) | fey +1) 


滤波 器 下 方 的 
图 像 部 分 的 像素 
图 3.28 ”使 用 大 小 为 3x3 的 滤波 器 模板 的 线性 空间 滤波 的 机 理 。 表 示 

滤波 器 模板 系数 的 坐标 所 选择 的 形式 简化 了 线性 滤波 的 表达 式 


3.4.2 ”空间 相关 与 卷 积 


在 执行 线性 空间 滤波 时 ， 必 须 清楚 地 理解 两 个 相近 的 概念 。 一 个 是 相关 ， 另 一 个 是 卷 积 。 如 前 节 
描述 的 那样 ， 相 关 是 滤波 器 模板 移 过 图 像 并 计算 每 个 位 置 乘积 之 和 的 处 理 。 卷 积 的 机 理 相似 ， 但 滤波 
器 首先 要 旋转 180。。 解 释 这 两 个 概念 的 区 别 的 最 好 方法 是 举 一 个 例子 。 我 们 从 一 个 一 维 示例 开始 。 

图 3.29 (a) 显示 了 一 个 一 维 函 数 f 和 一 个 滤波 器 w, 图 3.29 (b) 显示 了 执行 相关 的 起 始 位 置 。 我 们 注 
意 到 的 第 一 件 事情 是 存在 未 覆盖 的 部 分 函数 。 该 问题 的 解决 办 法 是 在 /的 任意 一 侧 补 上 足够 的 0, 以 
便 使 w 中 的 每 个 像素 都 可 访问 到 了 中 的 每 个 像素 。 如 果 滤波 器 的 尺寸 、 

是 m, 那么 需要 在 /的 一 侧 补 m1 个 0。 图 3.29(c) 显示 了 适当 填充 a ME een 
过 的 函数 。 相 关 的 第 一 个 值 是 如 图 3.29 (c) 所 示 的 初始 位 置 的 f 和 w E ea Gy 
的 乘积 之 和 (乘积 之 和 为 0) 。 这 相当 于 位 移 x= 0 。 为 了 得 到 相关 的 | SR mele 
第 二 个 值 ， 我 们 把 w 向 右 移 动 一 个 像素 的 位 置 (位 移 =1) ,并 计算 CARRE. 
乘积 之 和 。 结 果 还 是 0。 事实 上 ， 当 x=3 时 才 第 一 次 出 现 非 零 的 结果 ， 在 这 种 情况 下 ，w 中 的 8 覆 

盖 f 中 的 1， 相 关 的 结果 是 8。 按 照 这 种 方法 进行 处 理 ， 我 们 可 以 得 到 图 3.29 (g) 中 的 全 部 相关 结果 。 
注意 , x RT 12 个 值 ( 即 x=0;1,2,…,11) 使 w 滑 过 /以 便 w 中 的 每 个 像素 访问 中 的 每 个 像素 。 K 





~~ 
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通常 ， 我 们 喜欢 使 用 大 小 与 了 相同 的 相关 阵列 ， 在 这 种 情况 下 ， 我 们 将 全 部 相关 结果 裁 前 到 原 函 数 大 


小 ， 如 图 3.29 (h) 所 示 。 


相关 卷 积 
原点 y w j zx 一 原点 f 旋转 了 180? 的 w 
(a) 00010000 123.238 00010000 Be Del (i) 
+ 
(b) 00010000 00010000 (j) 
12328 8-2 3. 2k 
E 开始 位 置 对 齐 
- 零 填充 
(cc) 0000000100000000 0000000100000 0 0 0 (K) 
£235 23 ie a ae igs | 
(dd) 0000000100000000 0000000100000000 (I) 
12.3 Bx E239 24 


© 移动 一 次 后 的 位 置 


()0000000100000000 0000000100000 0 0 0 (m) 
taD Ss 8 2°S°-2-1 
4_ 移动 四 次 后 的 位 置 
f) OO 0O0000TO00000000 0000000100000 0 0 0 (n) 
1 2734278 fe E E AE N 
最 终 位 置 -人 
全 部 相关 结果 全 部 卷 积 结果 
(g) 000823210000 000123280000 (0) 
裁 前 后 的 相关 结果 裁剪 后 的 卷 积 结果 
(h) 0 8 2°3-2 1 00 C1232 8 010 (p) 


图 3.29 具有 离散 单位 冲 激 的 滤波 器 的 一 维 相关 与 卷 积 的 说 明 


从 前 一 段 的 讨论 可 知 ， 有 两 个 要 点 需要 注意 。 第 一 ， 相 关 是 滤波 器 位 移 的 函数 。 换 名 话说， 相关 
的 第 一 个 值 对 应 于 滤波 器 的 零 位 移 ， 第 二 个 值 对 应 于 一 个 单元 位 移 ， 等 等 。 第 二 ， 滤 波 器 w 与 包含 有 
全 部 0 和 单个 1 的 函数 相关 ,得 到 的 结果 是 w 的 一 个 副本 , 但 旋转 了 180° 。 我 们 将 包含 单个 1 而 其 余 
都 是 0 的 函数 称 为 离散 单位 冲 激 。 因 此 ， 我 们 得 出 结论 : 一 个 函数 与 离散 单位 冲 激 相关 ， 会 在 该 冲 激 
位 置 产生 该 函数 的 一 个 翻转 版 本 。 

卷 积 的 概念 是 线性 系统 理论 的 基石 。 正 第 4 章 介 绍 的 那样 ， 卷 积 的 基本 特性 是 某 个 函数 与 某 个 单 
位 冲 激 卷 积 ， 得 到 函数 在 该 冲 激 处 的 一 个 副本 。 在 前 一 段 中 我 们 看 到 ， 相 关 操 作 也 得 到 函数 的 一 个 副 
本 ,但 该 副本 旋转 了 180° 。 因 此 ， 如 果 我 们 预先 旋转 滤波 器 ， 并 执行 相同 的 滑动 乘积 求 和 操作 ， 就 应 


该 能 得 到 希望 的 结果 。 如 图 3.29 右边 一 列 所 示 的 那样 ， 情 况 的 确 如 此 。 [iD 
由 此 ,我 们 看 到 ,为 了 执行 卷 积 , 我 们 需要 做 的 是 把 一 个 函数 旋转 180* , 
然后 执行 相关 中 的 相同 操作 。 如 结果 所 示 ， 我 们 旋转 两 个 函数 的 做 法 


没有 区 别 。 
如 图 3.30 所 示 ， 前 面 的 概念 很 容易 扩展 到 图 像 。 对 于 大 小 为 mxn 的 滤波 器 ， 我 们 在 图 像 的 顶部 和 
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底部 至 少 填充 六 -1 行 0, FEAL AMUSE n —1 91) 0. 在 这 种 情况 下 , m 入 等 于 3, 因此 , 如 图 3.30(b) 
所 示 , 我 们 用 两 行 0 填充 图 像 的 顶部 和 底部 , 用 两 列 0 填充 图 像 的 左 侧 和 右 侧 。 图 3.30 (ce) 显示 了 执行 相 
关 操 作 的 滤波 器 模板 的 初始 位 置 , 图 3.30(d) 显示 了 所 有 相关 操作 的 结果 。 图 3.30 (e) 显示 了 裁剪 后 的 相 
应 结果 。 再 一 次 注意 到 ， 结 果 旋 转 了 180。。 对 于 卷 积 ， 与 前 面 一 样 ， 我 们 预先 旋转 模板 ， 然 后 使 用 刚 
才 描述 的 方法 对 乘积 做 滑动 求 和 操作 。 图 3.30 (f E h) 显示 了 结果 。 我 | 在 一 维 情况 下 ， 旋 续 180s 等 同 于 
们 再 次 看 到 ， 一 个 函数 与 一 个 冲 激 卷 积 ， 在 该 冲 激 的 位 置 复制 了 这 个 “| 沿 一 个 坐标 轴 翻 转 模板 然后 沿 另 一 
函数 。 如 果 滤 波 器 模板 是 对 称 的 ， 很 明显 ， 相 关 和 卷 积 将 得 到 相同 的 “| 个 举 标 轴 再 次 翻转 模板 。 

结果 。 





J” 原点 f(x,y) 000000000 
000 0 0 a0 0 071 00 0 0 
000 0 0 wx,y) 0000000 0 0 
0010 0 FATA 1020 O00 OO OO 
000 0.0 405 6020.0) 0.06050 +0, 0 
00 0 0.0 Ts 9 “0 0 0 0°O 0°0'°0'D 
(a) (b) 
w 的 初始 位 置 全 部 相关 结果 裁剪 后 的 相关 结果 


iT 2 3 000000 0600000000 00 0'0 d 
4564000000 000000000 09870 
LF 89! Oe 05 Ded De O00, O 020.0 0.40. 0,0.645 4 0 
OD 700 OOo <8 © OO Sy O00 0" “OS oT 0 
0° 00-0) tm ON 675940. 0 0° OH 00 6 
000000000 000321000 
000000000 000000000 
000000000 0000000090 
000000000 00000000 0 


(c) (d) (e) 
y 旋 转 后 的 w 全 部 卷 积 结果 裁剪 后 的 卷 积 结果 
I9 8 7 000000 D00000000 00000 
654000000 00000000 0 OF Fi DSN 
321000000 000000000 04560 


Bi OBO 50,000 0.0 0 L223 0.0 BG. 7 89 人 
COT Or Par DoW "0 0 0 475 6 00 0° Ooo? 0 
}-D)-O20-0°O 0°O0'0 000789 00 0 
HO 019 608 o 80400000 0 0 
000000000 0000000 0 0 
000000000 0000 0 00 0 0 

(f) (g) (h) 


图 3.30 二 维 滤波 器 与 二 维 离散 单位 冲 激 的 相关 (中 间 一 行 ) 和 卷 积 ( 最 后 一 行 ) 。 为 便于 视觉 分 析 ，0 显示 为 灰色 


替代 包含 单个 1， 如 果 图 3.30 中 的 图 像 了 包含 一 个 与 w 完 全 相等 的 区 域 , 当 w 位 于 了 的 区 域 的 中 
心 时 , 相关 函数 ( 归 一 化 后 ) 的 值 将 是 最 大 的 。 这样， 正 像 我 们 将 在 第 12 章 看 到 的 那样 ,相关 还 可 以 用 
于 寻找 图 像 中 的 匹配 。 

下 面 以 公式 形式 总 结 一 下 前 面 的 讨论 。 一 个 大 小 为 mxn 的 滤波 右 w(x;y) 与 一 幅 图 像 f(x,y) 做 相 
关 操 作 ， 可 表示 为 w(x,y) 克 f(x,y) ， 它 由 上 一 节 末尾 列 出 的 公式 给 出 ， 为 方便 起 见 我 们 重 写 如 下 : 


a b 
w(x, Say) = > > ws,D)f (x+s, y+) (3.4-1) 


s=-at=—b 


这 一 等 式 对 所 有 位 移 变量 zx 和? 求 值 , 以 便 w 的 所 有 元 素 访问 f 的 每 个 像素 , 其 中 我 们 假设 了 已 被 
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适当 地 填充 。 正 如 早 些 时 候 解 释 的 那样 ，a =(m—1)/2,b=(n—1)/2, ， 同 时 ， 为 表示 方便 ,我 们 假设 六 
和 nn 是 奇 整数 。 
类 似 地 ，w(x,y) 和 (x,y) 的 卷 积 表示 为 w(x,y) 友 (x,y)”， 它 由 下 式 给 出 : 
a lt 通常 ， 在 含义 明确 的 情况 下 ， 我 们 用 
w(x, yk Say) = >》 >》 ws,D) f(r-s,y-t) (3.4-2) | piece, 9) TRH weya) 
serait’ BKw(x, ya f (x, y) KARR 
FP Sst A mS Zea ef (BERS 180°). AREAS Hea, ”| 的 结果 。 例 如 ， 参 见 前 一 节 林 尾 的 等 
我 们 遵循 惯例 ， 翻 转 和 移 位 w 而 非 六 结果 是 一 样 的。 与 相关 一 样 ，| 850。 
该 式 也 对 所 有 位 移 变 量 x 和 ?y 求 值 ， 因 此 ，w 的 每 个 元 素 访问 /中 的 每 个 像素 ， 同 样 我 们 也 假设 /了 
已 被 适当 地 填充 。 读 者 可 以 对 3x3 模板 展开 式 (3.4-2) ， 并 证 明 使 用 该 式 的 结果 与 图 3.30 中 例子 的 
结果 相同 。 在 实践 中 ， 我 们 常用 一 个 算法 实现 式 (3.4-1) 。 如 果 我 们 想 要 执行 相关 ， 可 将 w 输入 到 
算法 中 ; 如 果 要 执行 卷 积 , 可 将 旋转 180。 后 的 w 输 入 到 算法 中 。 反 过 来 , 如 果 代 之 以 执行 式 (3.4-2) 
也 可 行 。 

如 之 前 提 及 的 那样 ， 卷 积 是 线性 系统 理论 的 基础 。 我 们 将 在 第 4 章 中 学 到 ， 一 个 函数 与 单位 冲 激 
的 卷 积 ， 相 当 于 在 单位 冲 激 的 位 置 处 复制 该 函数 ， 这 一 特性 在 大 量 重要 的 推导 中 扮演 核心 的 角色 。 我 
们 将 在 第 4 章 关 于 传 里 叶 变 换 和 卷 积 定理 的 内 容 中 再 次 回顾 卷 积 。 然 而 ， 不 像 式 (3.4-2) ， 我 们 将 要 处 
理 的 卷 积 是 相同 尺寸 的 。 公 式 的 形式 是 一 样 的 ， 但 求 和 限 不 一 样 。 

”使 用 相关 或 卷 积 执行 空间 滤波 是 优选 方法 。 事实 上 ， 因 为 无 论 是 式 (3.4-1) 还 是 式 (3.4-2) ， 都 可 以 
通过 简单 地 旋转 滤波 器 来 执行 相应 的 功能 ， 重 要 的 是 在 给 定 的 滤波 任务 中 ， 按 对 应 于 期 望 操作 的 方式 
来 指定 滤波 器 模板 。 本 章 中 的 所 有 线性 空间 滤波 结果 都 基于 式 (3.4-1) 。 

最 后 ， 我 们 指出 ， 在 图 像 处理 文 献 中 , 读者 很 可 能 会 遇 到 卷 积 滤波 器 、 卷 积 模板 或 卷 积 核 这 些 术 
语 。 按 惯例 ， 这 些 术语 用 来 表示 一 种 空间 滤波 器 ， 并 且 滤 波 器 未 必用 于 页 正 的 卷 积 。 类 似 地 ， 模 板 与 
图 像 的 卷 积 通常 用 于 表示 我 们 刚刚 讨论 的 滑动 乘积 求 和 处 理 ， 而 不 必 区 分 相关 与 卷 积 间 的 差别 。 更 合 
适 的 是 ， 它 通常 用 于 表示 两 种 操作 之 一 。 这 一 不 太 严 密 的 术语 是 产生 混淆 的 根源 。 


3.4.3 线性 滤波 的 向 量 表示 
当 我 们 的 兴趣 在 于 相关 或 卷 积 的 模板 的 响应 特性 时 ， 有 时 写成 乘积 的 求 和 形式 是 方便 的 : 


x wi SL up :三 关于 向 量 和 矩阵 的 基本 知识 ， 
EMAA Waza EE Min Dm ER BAS) | 请 于 者 查阅 本 书 网 站 上 的 Tuiorias 部 
分 。 
式 中 w 项 是 大 小 为 mxn 的 滤波 器 的 系数 ，z 是 由 滤波 器 覆盖 的 相应 图 


像 的 灰 度 值 。 如 果 兴 趣 是 使 用 式 (3.4-3) 来 做 相关 ， 则 可 用 给 定 的 模板 。 为 
使 用 相同 的 公式 进行 卷 积 操作 ， 如 上 节 描 述 的 那样 ， 我 们 可 以 简单 地 把 模 
板 旋转 180” 。 它 意味 着 式 (3.4-3) 对 特定 的 坐标 对 (xc 妨 是 成 立 的 。 在 下 一 节 
中 , 我 们 将 了 解 为 什么 这 一 表示 法 对 于 描述 给 定 的 线性 滤波 器 的 特性 是 方 
便 的 。 

作为 一 个 例子 , 图 3.31 显示 了 一 个 带 有 标号 的 普通 3x3 模板 。 在 这 种 ” 图 3.31 普通 3x3 滤 波 器 
情况 下 ， 式 (3.4-3) 变 为 模板 的 另 一 种 表示 








D 因为 卷 积 满足 交换 律 ， 故 有 wax ykf y) = (x, 力克 w(x,y) 。 相 关 则 不 满足 交换 律 ， 这 一 点 可 通过 和 颠倒 图 3.29(a) 中 函数 的 
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9 
R= wz, + WZ) ++ WoZy = yz =w'z (3.4-4) 
k=l 


sth, w 是 由 模板 的 系数 形成 的 9 维 向 量 ，z 是 由 模板 包含 的 图 像 灰 度 形成 的 9 维 向 量 。 

3.44 空间 滤波 器 模板 的 产生 

生成 一 个 大 小 为 mxn 的 线性 空间 滤波 器 要 求 指定 mn 个 模板 系数 ， 这 些 系数 是 根据 该 滤波 器 
支持 什么 样 的 操作 来 选择 的 ， 记 住 ， 线 性 滤波 的 作用 实现 乘积 求 和 操作 。 例 如 ， 假 设 我 们 想 要 将 
图 像 中 的 这 些 像素 替换 为 以 这 些 像素 为 中 心 的 3x3 邻 域 的 平均 灰 度 。 图 像 中 任意 位 置 (x, y) 的 灰 度 
平均 值 是 以 (x,y) 为 中 心 的 3x3 邻 域 中 的 9 个 灰 度 值 之 和 除 以 9。 S z,i=1,2,… ,9 表示 这 些 灰 度 ， 
则 平均 灰 度 为 


1 9 
aoe 


但 该 式 与 系数 值 为 w =1/9 的 式 (3.4-4) 相 同 。 换 句 话 说， 使 用 系数 为 1/9 的 3x3 模板 进行 线性 滤波 操 
作 可 实现 所 希望 的 平均 。 正 如 下 一 节 中 将 要 讨论 的 那样 ， 这 一 操作 将 导致 图 像 平 滑 。 在 下 面 几 节 中 ， 
我 们 讨论 基于 这 种 方法 的 其 他 几 个 滤波 器 模板 。 

在 某 些 应 用 中 , 我 们 有 一 个 具有 两 个 变量 的 连续 函数 , 目的 是 基于 该 函数 得 到 一 个 空间 滤波 模板 。 
例如 ， 有 两 个 变量 的 一 个 高 斯 函数 有 如 下 基本 形式 : 

h(x, y) = CA 

式 中 ，'o 是 标准 差 ， 并 上 且 我 们 通常 假设 坐标 x 和 ?是 整数 。 譬 如， 为 了 从 该 函数 产生 一 个 大 小 为 3x3 
的 滤波 器 模板 ， 我 们 关于 其 中 心 进行 取样 。 因 此 有 w = A(-1, -1), w =h(-1,0),…，w =h(1,1)。 使 
用 类 似 的 方式 可 产生 一 个 mxn 滤波 器 模板 。 回 顾 可 知 ,， 二 维 高 斯 函数 具有 钟 形 形 状 , 并 且 其 标准 差 控 
HEJER “RE”. 

产生 非 线性 滤波 器 要 求 我 们 确定 邻 域 的 大 小 ， 以 及 对 包含 在 邻 域内 的 图 像 像素 执行 的 操作 。 例 
如 ， 回 忆 可 知 最 大 操作 是 非 线性 的 ( 见 2.6.2 节 ) ， 以 一 幅 图 像 中 任意 一 点 a, 3» 为 中 心 的 一 个 5x5 最 
大 滤波 器 得 到 25 个 像素 中 的 最 大 灰 度 值 ， 并 将 该 值 赋 给 处 理 后 图 像 中 位 置 为 (x,y) 的 像素 。 非 线性 
滤波 器 功能 非常 强大 ， 如 本 章 稍 后 和 第 5 章 中 显示 的 那样 ， 在 某 些 应 用 中 它 可 执行 超出 线性 滤波 器 
能 力 的 功能 。 


3.5 ”平滑 空间 滤波 器 


平滑 滤波 器 用 于 模糊 处 理 和 降低 噪声 。 模 糊 处 理 经 常用 于 预 处 理 任务 中 ， 例 如 在 (大 ) 目标 提取 之 
前 去 除 图 像 中 的 一 些 琐碎 细节 ， 以 及 连接 直线 或 曲线 的 颖 阶 。 通 过 线性 滤波 和 非 线性 滤波 模糊 处 理 ， 
可 以 降低 噪声 。 


3.5.1 平滑 线性 滤波 器 


平滑 线性 空间 滤波 器 的 输出 (响应 ) 是 包含 在 滤波 器 模板 邻 域内 的 像素 的 简单 平均 值 。 这 些 滤波 器 
有 时 也 称 为 均值 滤波 器 。 如 前 节 提 到 的 那样 ， 也 可 以 把 它们 归 和 人 低 通 滤波 器 。 

平滑 滤波 器 的 基本 概念 非常 直观 。 它 使 用 滤波 器 模板 确定 的 邻 域内 像素 的 平均 灰 度 值 来 代替 图 像 
中 每 个 像素 的 值 ， 这 种 处 理 的 结果 降低 了 图 像 灰 度 的 “尖锐 ”变化 。 由 于 典型 的 随机 噪声 由 灰 度 级 
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的 急剧 变化 组 成 , 因此, 常见 的 平滑 处 理应 用 就 是 降低 噪声 。 然 而 , 由 于 图 像 边缘 (几乎 总 是 一 幅 图 像 
希望 有 的 特性 ) 也 是 由 图 像 灰 度 尖锐 变化 带 来 的 特性 ,所 以 均值 滤波 处 理 还 是 存在 着 不 希望 有 的 边缘 模 
糊 的 负面 效应 。 男 外 ， 这 类 处 理 的 其 他 应 用 包括 如 2.4.3 节 讨 论 过 的 由 于 灰 度 级 数量 不 足 而 引起 的 伪 轮 
廊 效 应 的 平滑 处 理 。 均 值 滤波 器 的 主要 应 用 是 去 除 图 像 中 的 不 相关 细节 ， 其 中 “不 相关 ”是 指 与 滤波 
器 模板 尺寸 相 比较 小 的 像素 区 域 。 这 将 在 本 节 稍 后 的 应 用 中 加 以 说 明 。 

图 3.32 显示 了 两 个 3x3 平滑 滤波 器 。 第 一 个 滤波 器 产生 模板 下 方 的 标准 像素 平均 值 。 把 模板 系数 
代入 式 (3.4-4) 即 可 清楚 地 看 出 这 一 点 : 


1 9 
R 是 由 模板 定义 的 3x3 邻 域内 像素 灰 度 的 平均 值 。 注 意 ， 代 替 上 式 中 的 1/19， 滤 波 器 的 系数 全 为 “1”。 
这 里 的 概念 是 系数 取 1 值 时 计算 更 有 效 。 在 滤波 处 理 之 后 ， 整 个 图 像 除 以 9,。 一 个 mxn 模 板 应 有 等 于 


lmn 的 归 一 化 常数 。 所 有 系数 都 相等 的 空间 均值 滤波 器 有 时 称 为 售 状 滤波 器 。 

图 3.32 所 示 的 第 二 个 模板 更 为 重要 。 该 模板 产生 所 谓 的 加 权 平 均 ， 使 用 这 一 术语 是 指 用 不 同 的 系 
数 乘 以 像素 ， 即 一 些 像素 的 重要 性 (权重 ) 要 比 另 一 些 像素 的 重要 性 大 。 在 图 3:32(b) 所 示 的 模板 中 ， 处 
于 该 模板 中 心 位 置 的 像素 所 乘 的 值 比 其 他 任何 像素 所 乘 的 值 都 要 大 ， 因 此 ， 在 均值 计算 中 为 该 像素 提 
供 更 大 的 重要 性 。 其 他 像素 如 同 是 模板 中 心 距离 的 函数 那样 赋 以 成 反比 的 权重 。 由 于 对 角 项 离 中 心 比 
离 正 交 方向 相 邻 的 像素 (参数 为 V2 ) 更 远 ， 因 此 其 权重 比 与 中 心 直 接 相 邻 的 像素 更 小 。 赋 予 中 心 点 最 
高 权重 ,然后 随 着 距 中 心 点 距离 的 增加 而 减 小 系数 值 的 加 权 策略 的 目的 ， 是 在 平滑 处 理 中 试图 降低 模 
糊 。 我 们 也 可 选择 其 他 权重 来 达到 相同 的 目的 。 然而 , 图 3.32(b) 所 示 模 板 中 所 有 系数 的 和 等 于 16, 对 
于 计算 机 计算 来 说 是 一 个 有 吸引 力 的 特性 ， 因 为 它 是 2 的 整数 次 究 。 在 实践 中 ， 由 于 这 些 模 板 在 一 幅 
图 像 中 任何 一 个 位 置 所 跨 过 的 区 域 很 小 ,通常 很 难看 出 使 用 图 3.32 中 的 各 种 模板 或 类 似 方式 进行 平滑 
处 理 后 的 图 像 之 间 的 区 别 。 





图 3.32 两 个 3x3 平 滑 (均值 ) 滤波 器 模板 。 每 个 模板 前 面 的 乘 
数 等 于 1 除 以 所 有 系数 之 和 ， 这 是 计算 平均 值 所 要 求 的 


参见 式 (3.4-1) ,一 幅 M x N 图 像 经 过 一 个 mxn (m 和 n 是 奇数 ) 的 加 权 均 值 滤波 絮 滤 波 的 过 程 可 
由 下 式 给 出 : 


a b 
YY ws, Of +s, y+ 
g(x, y) = ee 一 一 (3.5-1) 
YY ve 
s=-at=—b 
上 式 中 的 参数 见 式 (3.4-1) 中 的 定义 。 如 前 所 述 ， 它 可 以 这 样 理 解 ， 即 一 幅 完全 滤波 的 图 像 是 通过 对 
X=0,1,2,…,M 一 1 和 y=0,1,2,…, NN 一 1 执行 式 (3.5-1) 得 到 的 。 式 (3.5-1) 中 的 分 母 部 分 简单 地 表示 为 
模板 的 各 系数 之 和 ， 它 是 一 个 仅 需 计算 一 次 的 常数 : 
175 
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例 3.13 使 用 各 种 尺寸 的 模板 z 滑 图 oy 
尺寸 有 ; | na m- 3, 


而 且 有 >t LFA HCE = SE 明显 地 区 分 开 来 这 表明 当 目标 的 灰 度 与 其 
相 邻 像素 的 灰 度 接近 时 ,会 导致 模糊 目标 的 混合 效应 。 m= 15 和 35 时 ， 就 图 像 中 目标 物 的 尺寸 来 说 , 已 属 
极端 博 况 。 这 种 极端 类 型 的 模糊 处 理 通常 用 于 去 除 图 像 中 的 一 些小 物体 。 例如 , 在 图 3.35 (9 中 ,三 个 小 方 框 、 

两 个 小 圆圈 及 大 部 分 噪声 矩形 区 域 已 融 人 背景 。 注 意 ， 在 这 幅 图 中 还 有 明显 的 黑 边界 。 这 是 我 们 用 0( 黑 色 ) 
填充 原 图 像 的 边界 ， 经 过 污 波 后 再 去 除 填充 区 域 的 结果 。 某 此 黑色 混入 了 所 有 滤波 后 的 图 像 ， 但 对 于 使 用 
较 大 滤波 器 平滑 的 图 像 ， 这 就 会 成 为 问题 。 ny 
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图 3.33 (a) K/N} 500x 500 像素 的 原 图 像 ;(b)~( 人 用 大 小 分 别 为 m=3, 5, 9, 15 和 35 的 方形 均值 滤波 模板 平滑 
处 理 的 结果 。 顶 部 的 黑色 方块 大 小 分 别 为 3, 5, 9, 15, 25, 35, 45 和 55 个 像素 ,它们 的 边界 相隔 25 个 像素 。 
底部 字母 的 大 小 在 10 磅 到 24 磅 之 间 ， 增 量 为 2 磅 ; 顶部 的 最 大 字母 为 60 磅 。 垂 直线 段 条 宽 为 5 个 像 
素 ， 高 为 100 个 像素 ， 线 条 间距 为 20 个 像素 。 圆 的 直径 为 25 个 像素 ， 它 们 的 边界 相隔 15 个 像素 ， 灰 度 
级 为 0% 到 100% 的 黑色 范围 内 ， 以 20% 增 加 。 图 像 背景 为 黑色 的 10%。 噪 声 矩 形 区 域 大 小 为 50x120 像素 


如 早 些 时 候 提 到 的 那样 ， 空 间 均值 处 理 的 一 个 重要 应 用 是 ， 模 糊 图 像 以 便 得 到 感 兴趣 物体 的 粗略 
描述 ， 因 此 那些 较 小 物体 的 灰 度 就 会 与 背景 混合 在 一 起 ， 较 大 物体 则 变 得 像 “ 斑 点 ”而 易于 检测 。 模 
板 的 大 小 由 那些 即将 融入 背景 中 的 物体 尺寸 决定 。 作 为 实例 ,考虑 图 3.34(a) ， 它 是 绕 地 轨道 上 的 哈 勃 
望远镜 拍摄 的 一 幅 图 像 。 图 3.34(b) 显示 了 应 用 15x15 均值 滤波 器 模板 对 该 图 像 处 理 后 的 结果 。 可 以 看 
到 ， 图 像 中 的 一 些 部 分 要 么 已 融和 人 背景， 要 么 亮度 明显 降低 。 像 这 样 利 用 阔 值 处 理 并 基于 物体 亮度 来 
消除 某 些 物体 的 操作 是 很 典型 的 。 使 用 等 于 模糊 图 像 最 高 亮度 25% 的 阔 值 ， 并 用 图 3.2 (b) 的 闽 值 函数 
处 理 的 结果 示 于 图 3.34(c) 中 。 将 该 结果 与 原 图 像 比较 ,我们 看 到 ， 考 虑 图 像 中 最 大 、 最 亮 物 体 的 表达 
方式 是 合理 的 。 
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2 iy . abe 
Al 3.34 (a) AW PRS eI 528 x 485 像素 的 图 像 ;(b) 由 15x15 均值 模 
板 滤 波 后 的 图 像 ; (c) 对 图 (b) 进行 阔 值 处 理 后 的 结果 ( 原 图 像 由 NASA 提供 ) 


3.5.2 统计 排序 ( 非 线性 ) 滤波 器 


统计 排序 滤波 器 是 一 种 非 线 性 空间 滤波 器 ， 这 种 滤波 器 的 响应 以 滤波 器 包围 的 图 像 区 域 中 所 包 
的 像素 排序 (排队 ) 为 基础 ， 然 后 使 用 统计 排序 结果 决定 的 值 代替 中 心 像素 的 值 。 这 一 Perea 
波 器 是 中 值 滤波 器 ， 如 其 名 称 暗 示 的 那样 ， bea ead Rite ali RFA) 
代替 该 像素 的 值 。 中 值 滤波 器 的 使 用 非常 普遍 ， 因 为 对 于 一 定 类 型 的 随机 噪声 ， 它 提供 了 一 种 优秀 的 
去 噪 能 力 ， 而 且 比 相同 尺寸 的 线性 平滑 滤波 器 的 模糊 程度 明显 要 低 。 Pe aetna 
A, DARA ARR, AME E MA Se ste te REM. 

一 个 数值 集合 的 中 值 上 是 这 样 的 数值 : 数值 集合 中 有 一 半 小 于 等 于 上 ， 还 有 一 半 大 于 等 于 上 。 为 
了 对 一 幅 图 像 上 的 某 个 点 进行 中 值 滤波 处 理 ， 首 先 将 邻 域 内 的 像素 分 类 排序 ， 确 定 其 中 值 ， 并 将 中 值 
赋予 滤波 后 图 像 中 的 相应 像素 点 ,例如 , 对 于 一 个 3x3 邻 域 , 其 中 值 是 第 5 个 最 大 的 值 , 而 在 一 个 5x5 
邻 域 中 ， 中 值 就 是 第 13 个 最 大 的 值 , 等 等 。 当 邻 域 中 的 一 些 像素 值 相 同时 ， 所 有 相等 的 值 都 可 以 作为 
中 值 。 假 如 ,在 一 个 3x3 邻 域 内 有 一 系列 像素 值 (10, 20, 20, 20, 15, 20, 20, 25, 100) , 这 些 值 排序 后 为 (10， 
15, 20, 20, 20, 20, 20, 25, 100) ， 那 么 中 值 就 是 20。 这 样 ， 中 值 滤波 器 的 主要 功能 就 是 使 拥有 不 同 灰 度 
的 点 看 起 来 更 接近 于 它 的 相 令 点。 事实 上 ， 我 们 使 用 mxm 中 值 滤 波峰 来 去 除 那些 相对 于 其 邻 域 像素 
更 亮 或 更 暗 ， 且 其 区 域 小 于 m? /2 (滤波 器 区 域 的 一 半 ) 的 孤立 像素 族 。 在 这 种 情况 下 ,， “去除 ”的 意思 
A 较 大 的 族 所 受到 的 影响 明显 较 小 

在 图 像 处 理 中 ， 尽 管 中 值 滤波 器 是 使 用 得 最 为 广泛 的 统计 排序 滤波 器 ， 但 并 不 意味 着 它 是 唯 
一 的 。 中 值 象征 一 后 的 第 50% 个 值 ， 但 根据 基本 统计 学 可 知 ， 排 序 也 适用 于 其 他 
不 同 的 情况 。 例 如 ， 可 以 取 第 100% 个 值 ， 即 所 谓 的 最 大 值 滤波 器 ， 这 种 滤波 器 在 搜寻 一 幅 图 像 中 
的 最 亮点 时 非常 有 用 。3x3 最 大 值 滤波 器 的 响应 可 以 由 式 尺 = max {zi | 大 =12,…,9} 给 出 。 相反 
取 第 0% 个 值 的 滤波 器 就 是 所 谓 的 最 小 值 滤波 器 ， ENA TA 的 | ermana, meos Dae 


目的 。 中 值 、 最 大 值 、 最 小 值 和 其 他 非 线性 滤波 器 将 在 5.3 节 中 详 一 一 一 一 一 
细 介 绍 。 


J 


3.14 利用 中 值 滤波 降 噪 。 

13.35 (a) 显示 了 一 幅 被 椒盐 噪声 污染 的 电路 板 的 X 射线 图 像 。 为 了 说 明 这 种 情况 下 的 中 值 滤波 器 处 
理 效果 比 均值 滤波 咒 更 好 ， 我 们 在 图 3.35(b) 中 显示 了 用 3x3 邻 域 均值 模板 处 理 噪声 图 像 的 结果 ， 而 
在 图 3.35 (c) 中 显示 了 用 3x3 中 值 滤波 器 处 理 噪 声 图 像 的 结果 。 均 值 滤波 模糊 了 图 像 ， 并 且 噪 声 去 除 
性 能 也 很 差 。 在 这 种 情况 下 ， 中 值 滤波 的 性 能 要 远 优 于 均值 滤波 。 通 常 ， 中 值 滤波 要 比 均值 滤波 更 适 
合 去 除 椒盐 噪声 。 
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图 3 3.35 (a) rere 污染 的 电路 板 的 X HARR: (o) fas 3x3 SFA ORL FE (c) H 
3x3 中 值 滤波 器 降 噪 后 的 图 像 ( 原 图 像 由 Lixi 公司 的 Joseph E. Pascente 先生 提供 ) 


3.6 ” 锐 化 空间 滤波 器 


锐 化 处 理 的 主要 目的 是 突出 灰 度 的 过 渡 部 分 。 图 像 锐 化 的 用 途 多 种 多 样 ， 应 用 范围 从 电子 印刷 和 
医学 成 像 到 工业 检测 和 军事 系统 的 制导 等 。 在 上 一 节 中 ,我 们 了 解 到 ， 图 像 模 糊 可 通过 在 空间 域 用 像 
素 邻 域 平 均 法 实现 。 因 为 均值 处 理 与 积分 类 似 ， 在 录 辑 上 ， 我 们 可 以 得 出 锐 化 处 理 可 由 空间 微分 来 实 
现 这 一 结论 。 事 实 上 ， 的 确 如 此 ， 且 本 节 将 讨论 直 数 字 微 分 来 定义 和 实现 锐 化 算 子 的 各 种 方法 。 基 本 
上 ， 微 分 算 子 的 响应 强度 与 图 像 在 用 算 子 操作 的 这 一 点 的 突变 程度 成 正比 ， 这 样 ， 图 像 微 分 会 增强 边 
缘 和 其 他 突变 (如 噪声 ) ， 削 弱 灰 度 变 化 缓慢 的 区 域 。 


3.6.1 基础 


以 下 两 节 分 别 详细 讨论 基于 一 阶 微分 和 一 阶 微分 的 锐 化 滤波 器 。 在 讨论 具体 滤波 器 之 前 ， 先 回 
项 数字 意义 上 微分 的 某 些 基本 性 质 -为 简化 说 明 ， 主 要 集中 讨论 一 阶 微分 的 性 质 。 我 们 最 感 兴趣 的 
是 恒定 灰 度 区 域 中 , 穴 变 的 起 点 与 终点 (台阶 和 祭 坡 突变 ) ee 如 第 10 章 介绍 
的 那样 ， 这 些 类 型 的 突变 可 用 来 对 图 像 中 的 噪声 点 、 线 与 边缘 建 模 。 这 些 图 像 特征 过 渡 处 的 微分 性 
质 也 很 重要 。 
数字 函数 的 微分 可 用 不 同 的 未 语 定义 ， 也 存在 定义 这 些 差别 的 各 种 方法 。 然 而 ， 对 于 一 阶 微分 的 任 
ESI Lie OAEIAE IRIDNA; O) ERLE PRIOR 
3) 沿 斜坡 的 微分 值 非 零 。 类 似 地 ,任何 一 阶 微分 的 定义 必须 保证 以 下 几 点 : (DEERME; 
oe 阶 或 斜坡 的 起 点 处 微分 值 非 零 ，(3) 沿 斜坡 的 微分 值 非 零 。 因 为 我 们 处 理 的 是 数字 量 ， 其 值 是 
有 限 的 ， 所 以 最 大 灰 度 级 的 变化 也 是 有 限 的 ， 并 且 变 化 发 生 的 最 短 距离 是 在 两 相 邻 像素 之 间 。 
一 维 函数 f(x) 的 一 阶 微分 的 基本 定义 是 差 值 10.2.1 节 将 会 回 到 式 (3.6-1) ,并 
给 出 由 泰 贡 级 数 推导 出 它 的 方法 - E 
L- fard- fea) G.61) annae tess 
式 中 ,为 了 与 二 维 图 像 丽 数 /(X 旋 的 微分 保持 一 致 ;我 们 使 用 了 偏 导 | 二 
数 符号 。 对 于 二 维 函 数 ， 我 们 将 沿 两 不 鹤 间 轴 来 处 理 偏 微分 。 当 前 讨论 的 空间 微分 应 用 并 不 影响 我 们 
试图 采用 的 任何 方法 的 未 质 -很 明显 ， 当 冰 数 中 只 有 一 个 变量 时 ，Br/ar =df /dx ; 对 于 二 阶 微分 ， 这 
同样 也 成 立 。 
我 们 将 二 阶 微分 定义 为 如 下 差分 ， 


of 
RN EID YR) (3.6-2) 
x 
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很 容易 验证 这 两 个 定义 满足 前 面 所 说 的 条 件 。 为 了 解 这 一 点 ， 并 考察 数字 函数 一 阶 微分 和 二 阶 微分 间 
的 异同 点 ， 考 虑 图 3.36 中 的 例子 。 

图 3.36(b) (图 的 中 间 ) 显示 了 一 段 扫 描 线 。 小 方块 中 的 数值 是 扫描 线 中 的 灰 度 值 , 它们 作为 黑 点 画 
在 上 方 的 图 3.36 (a) 中 。 用 虚线 连接 这 些 点 是 为 了 帮助 我 们 看 得 更 清楚 。 如 图 中 所 示 ， 扫 描 线 包 含 一 个 
灰 度 斜坡 、 三 个 恒定 灰 度 段 和 一 个 灰 度 人 台阶。 圆圈 指出 了 灰 度 变化 的 起 点 和 终点 。 用 前 面 两 个 定义 计 
算出 的 图 3.36 (b) 中 扫描 线 的 一 阶 微分 和 二 阶 微分 画 在 图 3.36(c) 中 。 计算 点 x 处 的 一 阶 微分 时 , 我 们 用 
下 一 个 点 的 函数 值 减 去 该 点 的 函数 值 。 因 此 ， 这 是 一 个 “预测 未 来 ”的 操作 。 类 似 地 ， 要 在 x 点 计算 
二 阶 微分 ， 计 算 中 要 使 用 前 一 个 点 和 下 一 个 点 。 为 避免 前 一 个 点 和 下 一 个 点 处 于 扫描 线 之 外 的 情况 ， 
我 们 在 图 3.36 中 显示 了 从 序列 中 第 二 个 点 到 倒数 第 二 个 点 的 微分 计算 。 


a 
b 
c 


ie @ a-a- a 











-W8 0 0-1-1-1-1-10000050000 
三 阶 微分 0 0-1 000010000 5-5 000 
5 
ale i 
4 \ 
3 广 上 
pi | Wi 
| A 广汉 
0} D-0-0-O > e-em + 
SM gx | 
| i 
—3 。 一 阶 微分 
—4- O 二 阶 微分 
-sL a 


图 3.36 一 幅 图 像 中 一 段 水 平 灰 度 剖面 的 一 维 数字 函数 的 一 阶 微分 和 二 阶 微分 
的 说 明 。 在 图 (a) 和 图 (c) 中 ， 为 便于 观看 ， 已 用 虚线 将 数据 点 连接 起 来 


让 我 们 从 左 到 右 横 贯 剖面 图 ,考虑 一 阶 微分 和 二 阶 微分 的 性 质 。 首 先 ,我 们 遇 到 的 是 如 图 3.36 (b) 
All (c) 所 示 的 恒定 灰 度 区 域 ， 其 一 阶 微分 和 二 阶 微分 都 是 零 ， 因 此 两 者 都 满足 条 件 (1) 。 接 着 ,我 
们 遇 到 紧 随 台阶 的 一 个 灰 度 斜坡 ， 并 注意 到 在 斜坡 起 点 和 台阶 处 的 一 阶 微分 不 为 零 ， 类 似 地 ,在 
斜坡 和 台阶 的 起 点 和 终点 的 二 阶 微分 也 不 为 零 ; 因此 ， 两 个 微分 特性 都 满足 条 件 (2) 。 最 后 ,我 们 
看 到 ， 两 个 微分 特性 也 都 满足 条 件 (3) ， 因 为 对 于 斜坡 来 说 一 阶 微分 不 是 零 ， 二 阶 微分 是 零 。 请 注 
意 斜 坡 或 台阶 的 起 点 和 终点 处 二 阶 微分 的 符号 变化 。 事实 上 , 我们 在 图 3.36(c) 中 看 到 ,在 一 个 台 
阶 的 过 渡 部 分 ， 连接 这 两 个 值 的 线段 在 两 个 端点 的 中 间 与 水 平 轴 相 交 。 如 第 10 章 所 述 ， 零 交叉 对 

于 边缘 定位 是 非常 有 用 的 。 
数字 图 像 中 的 边缘 在 灰 度 上 通常 类 似 于 斜坡 过 渡 ， 因 此 会 导致 图 像 的 一 阶 微分 产生 较 粗 的 边 
182] 缘 ， 因 为 沿 斜 坡 的 微分 非 零 。 另 一 方面 ， 二 阶 微分 产生 由 零 分 开 的 一 个 像素 宽 的 双边 缘 。 由 此 ， 
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我 们 得 出 结论 ， 二 阶 微分 在 增强 细节 方面 要 比 一 阶 微分 好 得 多 ， 是 一 个 适合 锐 化 图 像 的 理想 特性 。 
如 本 节 稍 后 所 述 ， 二 阶 微分 比 一 阶 微分 执行 上 要 容易 得 多 ， 因 此 我 们 重点 介绍 二 阶 微分 。 


3.6.2 ”使 用 二 阶 微分 锐 化 图 像 一 一 拉 普 拉 斯 算 子 


本 节 介 绍 二 维 函 数 的 二 阶 微分 实现 及 其 在 图 像 锐 化 处 理 中 的 应 用 。 在 第 10 章 中 ,我 们 将 再 次 回 
到 微分 问题 上 来 ， 其 时 将 广泛 使 用 二 阶 微分 来 分 割 图 像 。 这 种 方法 基本 上 是 先 定义 一 个 二 阶 微分 的 离 
散 公 式 ， 然 后 根据 公式 构造 一 个 滤波 器 模板 。 我 们 重点 介绍 一 种 各 向 同性 滤波 器 ， 这 种 滤波 器 的 响应 
与 滤波 器 作用 的 图 像 的 突变 方向 无 关 。 也 就 是 说 ， 各 向 同性 滤波 器 是 旋转 不 变 的， 即将 原 图 像 旋 转 后 
进行 滤波 处 理 给 出 的 结果 ， 与 先 对 图 像 滤波 然后 再 旋转 的 结果 相同 。 

可 以 证 明 (Rosenfeld and Kak[1982]) , 最 简单 的 各 向 同性 微分 算 子 是 拉 普 拉 斯 算 子 。 一 个 二 维 图 像 
函数 f(x,y) 的 拉 普 拉 斯 算 子 定义 为 





2 2 
Vf at 
因为 任意 阶 微分 都 是 线性 操作 , 所 以 拉 普 拉 斯 变换 也 是 一 个 线性 算 子 。 为 了 以 离散 形式 描述 这 一 公式 ， 
我 们 使 用 式 (3.6-2) 的 定义 ， 记 住 ， 我 们 必须 支持 第 二 个 变量 。 在 x 方 向 上 ， 有 


(3.6-3) 


or 
| Bee PEELE Ie —Ly)-2f(,y) (3.6-4) 
类 似 地 ， 在 y 方 向 上 有 
of 
A Ad (3.6-5) 
所 以 ,满足 这 三 个 公式 的 两 个 变量 的 离散 拉 普 拉 斯 算 子 是 
V? fixy) = fatl, y+ fæ- y)+ f(x, p+)+ f(x, yl) -4f(x,y) (3.6-6) 


这 个 公式 可 以 用 图 3.37 (a) 的 滤波 模板 来 实现 ， 该 图 给 出 了 以 90° 为 增 量 进行 旋转 的 各 向 同性 结果 。 实 
现 机 理 与 3.5.1 节 中 给 出 的 线性 平滑 滤波 器 一 样 。 这 里 只 是 简单 地 使 用 了 不 同 的 系数 。 

对 角 线 方向 也 可 以 这 样 组 成 : 在 数字 拉 普 拉 斯 变换 的 定义 中 , 在 式 (3.6-6) 中 添 人 两 项 ， 即 两 个 对 
角 线 方 向 各 加 一 项 。 每 个 新 添加 项 的 形式 与 式 (3.6-4) 或 式 (3.6-5) 类 似 ， 只 是 其 坐标 轴 的 方向 沿 对 角 线 
方向 。 由 于 对 角 线 方向 上 的 每 项 还 包含 一 个 -27(0e7) ， 所 以 现在 从 不 同方 向 的 项 中 应 总 共 减 去 
-8f (x,y) o 13.37 (b) 显示 了 执行 这 一 新 定义 的 模板 。 这 种 模板 对 45° 增幅 的 结果 是 各 向 同性 的 。 我 
们 在 实践 中 可 能 常常 见 到 图 3.37(c) 和 (d) 所 示 的 拉 普 拉 斯 模板 。 它 们 是 由 式 (3.6-4) 和 式 (3.6-5) 中 用 过 
的 二 阶 微分 的 定义 得 到 的 ， 只 是 其 中 的 1 是 负 的 。 因 此 ， 它 们 产生 了 等 效 的 结果 ， 但 在 将 拉 普 拉 斯 滤 
波 后 的 图 像 与 其 他 图 像 合并 ( 相 加 或 相 减 ) 时 ， 必 须 考虑 符号 上 的 差别 。 

由 于 拉 普 拉 斯 是 一 种 微分 算 子 ， 因 此 其 应 用 着 重 于 图 像 中 的 灰 度 突变 区 域 ， 而 非 灰 度 级 缓慢 
变化 的 区 域 。 这 将 产生 暗色 背景 中 县 加 有 浅 灰 色 边 线 和 突变 点 的 图 像 。 将 原 图 像 和 拉 普 拉 斯 图 像 
至 加 在 一 起 的 简单 方法 ， 可 以 复原 背景 特性 并 保持 拉 普 拉 斯 锐 化 处 理 的 效果 。 如 上 一 段 中 所 述 ， 
使 用 的 拉 普 拉 斯 定义 很 重要 。 如 果 所 用 定义 的 中 心 系数 是 负 的 ， 要 得 到 锐 化 结果 ， 就 必须 从 原 图 
像 减 去 经 拉 普 拉 斯 变换 后 的 图 像 ， 而 不 是 加 上 它 。 因 此 ， 我 们 使 用 拉 普 拉 斯 增强 图 像 的 基本 方法 
可 表示 为 下 式 : 
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a(x») = fy) +e[ Vf»)| (3.6-7) 


HH, f(x,y) Al g(x,y) 分 别 是 输入 图 像 和 锐 化 后 的 图 像 。 如 果 使 用 图 3.37(a) 或 图 3.37 (b) 中 的 拉 普 拉 
斯 滤波 器 ， 则 常数 c = -1 ， 如 果 使 用 另外 两 个 滤波 器 ， 则 常数 c=1。 
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13.37 (a) 实现 式 (3.6-6) 所 用 的 滤波 器 模板 ; (b) 用 于 实现 带 有 对 角 项 的 
公式 的 扩展 模板 ; (c)~(d) 实践 中 常用 的 其 他 两 个 拉 普 拉 斯 实现 


例 .3.15 使 用 拉 普 拉 斯 算 子 锐 化 图 像 。 
图 3.38 (a) 显示 了 月 球 北极 的 一 幅 略 显 模糊 的 图 像 。 图 3.38 (b) 显示 了 使 用 图 3.37 (b) 中 的 拉 普 拉 斯 模板 
对 该 图 像 滤 波 后 的 结果 。 由 于 拉 普 拉 斯 图 像 中 既 有 正 值 又 有 负 值 ， 且 所 有 负 章 在 显示 时 都 修剪 为 0， 所 以 
图 像 的 大 部 分 是 黑色 的 。 
标定 拉 普 拉 斯 图 像 的 一 FORE, 先 让 其 最 小 值 加 上 一 个 代替 零 的 最 小 值 ， 然 后 将 结果 标定 到 整 
个 灰 度 范围 [0, 工 1] 内 ,如 同 式 (2.6-10) 和 式 (2.6-11) 中 解释 的 那样 .图 3.38(c) 是 用 这 种 方法 标定 过 的 图 像 。 
注意 ,该 图 像 的 支配 特征 位 于 边缘 和 灰 度 的 不 连续 处 。 前 述 的 黑色 背景 由 于 标定 ,现在 已 变 成 灰色 。 这 种 
浅 灰色 的 外 观 是 被 适当 标定 的 典型 拉 普 拉 斯 图 像 。 图 3.38 (d) 显示 了 在 c = -1 时 使 用 式 (3.6-7) 得 到 的 结果 ， 
该 图 像 的 细节 比 原 图 像 更 清晰 。 原 图 像 与 拉 普 拉 斯 处 理 结果 相 加 ， 可 以 使 图 像 中 的 各 灰 度 值 复 原 ， 而 且 拉 
普 拉 斯 处 理 增强 了 图 像 中 灰 度 突变 处 的 对 比 度 。 最 终结 果 是 使 图 像 中 的 细节 部 分 得 到 了 增强 ， 并 很 好 地 保留 
了 图 像 的 背景 色调 。 最 后 ， 图 3.38 (e) 显示 了 使 用 图 3.37 (b) 中 的 滤波 器 重复 前 述 过 程 的 结果 。 这 里 ， 我 们 注 
意 到 图 3.38 (d) 的 清晰 度 明显 提升 。 因为 使 用 了 图 3.37(b) 的 滤波 器 , 导致 在 对 角 方 向 上 产生 了 额外 的 区 别 ( 锐 
化 ) ， 这 并 不 令 人 意外 。 像 图 3.38 (d) 和 图 3.38 (e) 显示 的 这 些 结果 ， 使 得 拉 普 拉 斯 算 子 成 为 锐 化 数字 图 像 的 
GATA. 


abcde 





图 3.38 (a) 月 球 北极 的 模糊 图 像 ;(b) 未 标定 图 像 经 拉 普 拉 斯 滤波 后 的 结果 ; (c) 标定 图 像 经 拉 普 拉 斯 滤波 后 的 结 
R: (d 用 图 3.37 (a) 中 的 模板 锐 化 后 的 图 像 ;(e) 用 图 3.37 (b) 中 的 模板 锐 化 后 的 图 像 ( 原 图 像 由 NASA 提供 ) 
3.6.3” 非 锐 化 掩 菩 和 高 提升 滤波 
印刷 和 出 版 业已 用 多 年 的 图 像 锐 化 处 理 过 程 是 从 原 图 像 中 减 去 一 幅 非 锐 化 (平滑 ) 的 版 本 。 这 个 
称 为 非 锐 化 掩蔽 的 处 理 过 程 由 下 列 步 又 组 成 ， 
， 模 糊 原 图 像 
2， 从 原 图 像 中 减 去 模糊 图 像 (产生 的 差 值 图 像 称 为 模板 ) 。 
3. 将 模板 加 到 原 图 像 上 。 
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令 f(x, y) 表示 模糊 图 像 ， 非 锐 化 掩蔽 以 公式 形式 描述 如 下 。 首 先 ， 我 们 得 到 模板 : 


Emas (%7) = f(x, ¥)— f(x,y) (3.6-8) 
然后 ， 在 原 图 像 上 加 上 该 模板 的 一 个 权重 部 分 : 
g(x,y) = f(x,p)+k* gnask (X,y) (3.6-9) 


通常 ， 我 们 会 在 上 式 中 包含 一 个 权重 系数 klk > 0) 。 
“k= 1 时 ， 我 们 得 到 上 面 定义 的 非 锐 化 掩蔽 。 当 上 > 1 
时 ， 该 处 理 称 为 高 提升 滤波 。 选 择 上 < 1 则 不 强调 非 锐 化 
图 3.39 解释 了 非 锐 化 掩蔽 是 如 何 工 作 的 。 图 3.39 (a) 
中 的 灰 度 放 面 图 可 以 解释 为 通过 垂直 边缘 的 水 平 扫描 线 ， 
垂直 边缘 是 图 像 中 从 暗 区 到 亮 区 的 过 渡 。 图 3.39 (b) 显示 了 
平滑 后 的 结果 ， 为 了 参考 ， 该 结果 已 释 加 在 原始 信号 ( 显 
示 为 虚线 ) 上。 图 3.39 (c) 是非 锐 化 模板 ， 它 是 从 原始 信号 
中 减 去 模糊 信号 得 到 的 ,通过 将 该 结果 与 对 应 于 图 3.36 (a) 
中 斜坡 的 图 3.36 (c) 中 的 部 分 比较 ， 我 们 发 现 ， 图 3.39 (c) 
中 的 非 锐 化 模板 与 我 们 使 用 二 阶 微分 得 到 的 结果 非常 相 
似 。 图 3.39(d) 是 最 后 锐 化 的 结果 ， 它 是 通过 把 模板 加 到 
原始 信号 上 得 到 的 。 现 在 强调 ( 锐 化 ) 了 信号 中 出 现 灰 度 


a 
b 
c 
d 


图 3.39 





钝 化 模板 


锐 化 后 的 信号 


非 锐 化 掩蔽 机 理 的 说 明 : (a) 原始 信号 ; 
(b) 模 糊 信号 ， 为 便于 参考 ， 原 始 信 号 使 
用 虚线 显示 ; 〈c) 非 锐 化 模板 ; (d) 将 
图 (c) 和 图 (a) 相 加 得 到 的 锐 化 后 的 信号 


斜率 变化 的 点 。 观 察 添加 到 原 信和 号 中 的 负 值 。 这 样 ， 如 果 原 图 像 有 任何 零 值 ， 或 如 果 选 择 的 磊 值 大 
到 足以 使 模板 峰值 大 于 原 信号 中 的 最 小 值 时 ， 那 么 最 终 的 结果 可 能 会 存在 负 灰 度 。 负 值 将 导致 边缘 


周围 出 现 暗 色泽 轮 , 足够 大 时 会 产生 不 好 的 结果 。 
例 3.16 使 用 非 锐 化 掩蔽 锐 化 图 像 。 


图 3: 40(a) 显 示 了 暗 灰 背景 上 带 有 了 略微 模 白 色 文字 的 图 像 。 图 3.40(b) 是 使 用 大 小 为 5 5x5 Ho= 3 的 高 斯 
平滑 滤波 器 得 到 的 结果 ( 见 3.4.4 节 ) 。 图 3.40(c) 是 使 用 式 (3.6-8) 得 到 的 非 锐 化 模板 。 图 3.40(d) 是 用 非 锐 化 
模板 LRG. 6-9), RE 1] 得 到 的 结果 。 该 图 像 较 原 图 像 略 有 改进 ， 但 改进 应 能 更 为 明显 。 图 3 40(e) 显示 了 
使 用 式 (3.6-9) 并 令 k= 4.5 的 结果 ,这 是 我 们 能 用 的 最 大 可 能 值 ， bi 


图 像 与 原 图 像 相 比 已 有 明显 改进 。 


图 3.40 ”(a) 原 图 像 ;(b) 使 用 高 斯 滤波 器 模糊 的 结果 ; () 非 锐 化 模 
板 ; (d) 使 用 非 锐 化 掩蔽 的 结果 ; (e) 使 用 高 提升 滤波 的 结果 


3.6.4 使 用 一 阶 微分 锐 化 ( 非 线 性 ) 图 像 一 一 梯度 
图 像 处 理 中 的 一 阶 微分 是 用 梯度 幅 值 来 实现 的 。 对 于 函数 (x, y) , /在 坐标 (x,y) 处 的 梯度 定义 为 


二 维 列 向 量 


Ex 
= d = = 
Vf = grad( f) l d 


10.2.5 节 将 详细 讨论 梯度 。 这 里 ， 


(3.6-10) 。 | 我 们 仅 对 使 用 梯度 幅 值 锐 化 图 像 感 
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该 向 量具 有 重要 的 几何 特性 ， 即 它 指出 了 在 位 置 (x,y) 处 /的 最 大 变化 率 的 方向 。 
HE VS 的 幅 值 (长度) 表示 为 M(x,y) ， 即 


M(x,y)=mag(V/)= Vg +g; (3.6-11) 


它 是 梯度 向 量 方向 变化 率 在 (x,y) 处 的 值 。 注 意 ，M(x,y) 是 与 原 图 像 大 小 相同 的 图 像 ， 它 是 当 x 和 y 
允许 在 1 中 的 所 有 像素 位 置 变 化 时 产生 的 。 在 实践 中 ,该 图 像 通常 称 为 梯度 图 像 ( 含 义 清楚 时 ， 可 简称 
为 梯度 ) 。 

因为 梯度 向 量 的 分 量 是 微分 ， 所 以 它们 是 线性 算 子 。 但 该 向 量 的 幅度 不 是 线性 算 子 ， 因 为 求 幅度 
是 做 平方 和 平方 根 操作 。 另 一 方面 ， 式 (3.6-10) 中 的 偏 微分 不 是 旋转 不 变 的 (各 向 同性 ) ， 而 梯度 向 量 
的 幅度 是 旋转 不 变 的 。 在 某 些 实现 中 ， 用 绝对 值 来 近似 平方 和 平方 根 操作 更 适合 于 计算 : 


M(x,y) |g:|+|g,| (3.6-12) 


该 表达 式 仍 保留 了 灰 度 的 相对 变化 ， 但 通常 丢失 了 各 向 同性 特性 。 然 而 ， 像 拉 普 拉 斯 的 情况 那样 ， 后 
面 定 义 的 离散 梯度 的 各 向 同性 仅 在 有 限 旋转 增 量 的 情况 下 才 被 保留 ， 它 依赖 于 所 用 的 近似 微分 的 滤 
波 器 模板 。 结 果 表 明 ， 用 于 近似 梯度 的 常用 模板 在 90° 的 倍数 时 是 各 向 同性 的 。 这 些 结果 与 我 们 使 
用 式 (3.6-11) 还 是 使 用 式 (3.6-12) 无 关 ， 因 此 在 我 们 选择 这 样 做 时 ， 使 用 后 一 公式 对 结果 并 无 影响 。 

如 拉 普 拉 斯 情况 下 那样 ， 我 们 现在 离散 化 前 面 的 公式 ， 并 由 此 形成 合适 的 滤波 模板 。 为 简化 下 面 
的 讨论 ， 我 们 将 使 用 图 3.41 (a) 中 的 符号 来 表示 一 个 3x3 区 域内 图 像 点 的 灰 度 。 例 如 ， 使 用 图 3.28 中 
引入 的 符号 , 令 中 心 点 zs 表示 任意 位 置 (x,y) 处 的 f(x,y) ; 2, RAN f(x-Ly-lD; 等 等 。 如 3.6.1 
节 指 出 的 那样 ,满足 3.6.1 节 所 声明 条 件 的 对 一 阶 微分 的 最 简 近 似 是 g, = (zs — 25) Mg, =(z6 一 z;)。 在 
早期 数字 图 像 处 理 的 研究 中 ， 由 Roberts[1965] 提 出 的 其 他 两 个 定义 使 用 交叉 差分 : 


8, = (Z —25) Fl g, = (zg — 26) (3.6-13) 
如 果 使 用 式 (3.6-11) 和 式 (3.6-13) ， 则 梯度 图 像 计算 为 
1/2 
M(x,y) =| (zs -25)+ (z-z) | (3.6-14) 
如 果 用 式 (3.6-12) 和 式 (3.6-13) ， 则 
M(x,y) = |z9 —Z5|+|Zy -z| (3.6-15) 


按 此 前 的 描述 方式 ,很 容易 理解 x 和 y 会 随 图 像 的 维 数 变化 , 式 (3.6-13) 中 所 需 的 偏 微分 项 可 以 用 图 3.41 (b) 
中 的 两 个 线性 滤波 器 模板 来 实现 。 这 些 模板 称 为 罗伯特 交叉 梯度 算 子 。 

偶数 尺寸 的 模板 很 难 实现 ， 因 为 它们 没有 对 称 中 心 。 我 们 感 兴 趣 的 最 小 模板 是 3x3 模板 。 使 用 以 
zs 为 中 心 的 3x3 邻 域 对 g, 和 g, 的 近似 如 下 式 所 示 : 


Z =L a (2,422 +7)-(3 +22 +2) (3.6-16) 


0 
g, = +2 +29) (4 +24 +z) (3.6-17) 


这 两 个 公式 可 以 使 用 图 3.41 (d) 和 图 3.41 (e) 中 的 模板 来 实现 。 使 用 图 3.41 (d) 中 的 模板 实现 的 3x3 


图 像 区 域 的 第 三 行 和 第 一 行 的 差 近 似 x 方向 的 偏 微分 , 另 一 个 模板 中 的 第 三 列 和 第 一 列 的 差 近似 》 
189| 方向 的 微分 。 用 这 些 模 板 计 算 偏 微分 后 ， 就 得 到 了 之 前 所 说 的 梯度 幅 值 。 例 如 ,将 g, A g, 代入 
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式 (3.6-12) 得 到 
M (x, y) =|(z, +228 + Z))—(z, +22, + z3)| + |(z3 +2z6 + 29) —(z, +22, + 2,)| (3.6-18) 


13.41 (d) 和 图 3.41(e) 中 的 模板 称 为 Sobel 算 子 。 中 心 系 数 之 所 以 使 用 权重 2， 原 因 是 通过 突出 中 心 点 
的 作用 而 达到 平滑 的 目的 (第 10 章 中 将 详细 介绍 该 思想 ) 。 注 意 ， 图 3.41 所 示 的 所 有 模板 中 的 系数 总 和 
为 0， 这 正如 微分 算 子 的 期 望 值 那样 ， 表 明 灰 度 恒 定 区 域 的 响应 为 0。 


antte 
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图 3.41 (a) WARY 3 x3 KER (e EIRE); (b) ~(c) 罗伯特 交叉 梯度 算 
子 ; @D~OMAWRRARZAAS, MAAA F HAEE 


如 前 所 述 ，g, M g, 的 计算 是 线性 操作 ， 因 为 它们 涉及 微分 操作 ， 因 此 可 以 使 用 图 3.41 中 的 
空间 模板 如 乘积 求 和 那样 实现 。 使 用 梯度 进行 非 线 性 锐 化 时 ,涉及 M (x, y) 的 平方 和 平方 根 计算 ， 
或 使 用 绝对 值 计算 代替 ， 所 有 这 些 计算 都 是 非 线性 操作 。 该 操作 是 在 得 到 g, 和 g, 线 性 操作 后 执行 
的 操作 。 


例 3.17 使 用 梯度 增强 边缘 。 

工业 检测 中 常 使 用 梯度 处 理 ， 梯 度 处 理 一 般 用 于 辅助 人 工 检测 产品 缺陷 ,更 常用 于 自动 检测 的 预 处 理 。 
我 们 将 在 第 10 章 和 第 11 章 中 详细 介绍 梯度 处 理 。 下 面 考虑 一 个 简单 的 例子 ， 以 展示 梯度 法 如 何 增强 缺陷 
并 消除 缓慢 变化 背景 中 的 特征 。 在 这 个 例子 中 ， 增 强 用 做 自动 检测 的 预 处 理 步骤， 而 不 用 于 人 为 分 析 。 

图 3.42 (a) 显示 了 一 幅 隐形 眼镜 的 光学 图 像 ， 
它 由 设计 用 于 突出 缺陷 的 发 光 装 置 来 照明 , 例如 e 
4 点 方向 和 5 点 方向 眼镜 边界 上 的 两 个 边缘 缺 e 
BA» El 3.42 (b) 显示 了 使 用 式 (3.6-12) 及 图 3.41 (0) 与 
图 3.41(e) 中 的 两 个 Sobel 模板 得 到 的 梯度 图 像 。 在 
该 图 像 中 ,边缘 缺陷 清晰 可 见 ， 并 且 还 有 一 个 附加 ¢ 
的 优点 ， 即 去 掉 了 灰 度 不 变 或 变化 缓慢 的 图 案 阴 ie 
影 , 因此 简化 了 自动 检测 所 要 求 的 计算 任务 。 梯度 处 
理 还 可 突出 灰 度 图 像 中 看 不 见 的 小 斑点 (这 些小 斑点 
可 能 是 外 来 物 .保护 液 中 的 气泡 或 眼镜 中 的 小 缺陷 ) 。 
在 灰 度 平坦 区 域 中 增强 小 突变 的 能 力 , 是 梯度 处 理 的 
另 一 个 重要 特性 。 


3.7 ”混合 空间 增强 法 


到 目前 为 止 ， 除 了 一 些 特 殊 情况 ， 如 带 有 阔 值 处 理 ( 图 3.34) 的 混合 模糊 ， 我 们 主要 关注 的 还 是 单 
一 的 增强 法 。 通 常 ， 为 了 达到 令 人 满意 的 结果 ， 对 给 定 的 任务 需要 应 用 多 种 互补 的 图 像 增 强 技术 。 本 
节 将 通过 一 个 例子 来 说 明 怎 样 将 本 章 中 提 到 的 多 种 图 像 增 强 方法 结合 起 来 ， 以 便 完 成 困难 的 图 像 增 强 
任务 。 





图 3.42 (a) 隐形 眼镜 的 光学 a 4 点 和 
5 点 方向 边界 上 的 缺陷 ) ; (b) Sobel 梯度 
( 原 图 像 由 Perceptics ss Pete Sites 提供 ) 
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图 3.43 (a) 所 示 的 图 像 是 一 幅 人 体 骨 骼 核 扫描 图 像 ， 常 用 于 检查 人 体 疾 病 ， 如 骨骼 感染 和 肿瘤 。 我 
们 的 目的 是 通过 图 像 锐 化 突出 骨骼 的 更 多 细节 来 增强 图 像 3 à 图 像 灰 度 的 动态 范围 很 罕 、 并且 有 很 高 的 


噪声 ， 因此 很 难 对 其 进行 增强 对 此 ,我 们 采取 的 策略 是 ， 首 先 用 拉 普 拉 斯 法 突出 图 像 中 的 小 细节 ， 然 后 
用 梯度 法 突出 其 边缘 。 平滑 后 的 梯度 图 像 将 用 于 掩蔽 拉 普 D RGE FERAH LE] 2.30), 稍 后 会 对 


此 简短 说 明 时 好 我 们 将 试图 使 用 灰 度 变换 来 增 大 图 像 的 灰 度 动态 范围 

图 3.43 (b) 显示 了 使 用 图 3.37(d) 中 的 滤波 器 得 到 的 原 图 像 的 拉 普 拉 斯 操作 结果 。 该 图 像 使 用 
与 图 3.38 ( reddit 然后 ,根据 式 (3.6-7) , 简单 地 将 图 3.43 (a) 与 图 3.43 (b) 
相 加 ， 就 可 得 到 一 幅 锐 化 后 的 图 像 。 根 据 图 3.43 (b) 中 的 噪声 水 平 ， 我 们 可 以 预料 ， 如 果 将 图 3.43 (a) 
和 图 3.43 (b) 相 加 ,会 导致 相当 多 的 噪声 ,这 可 在 图 3.43 (c) 中 得 到 证 实 。 于 是 我 们 可 立刻 想到 ， 降 低 噪 
声 的 一 种 方法 是 使 用 中 值 滤波 器 。 然而 , 中 值 滤波 器 是 一 种 非 线性 滤波 器 , 它 有 可 能 改变 图 像 的 性 质 
这 在 医学 图 像 处 理 中 是 不 能 接受 的 。 
abeced 





图 3.43 (a) 全 身 骨 骼 扫描 图 像 ; (b) 图 (a) 经 拉 普 拉 斯 操作 后 的 结果 ; (c) 将 图 (a) 
和 图 (b) 相 加 得 到 的 锐 化 图 像 ;(d) 图 (a) 经 Sobel 梯度 处 理 后 的 结果 





图 3.43 ( 续 ) ”(e) 使 用 5x5 均值 滤波 器 平滑 后 的 Sobel 图 像 ; (由 图 (ec) 和 图 (e) 相 乘 形 成 的 掩蔽 
AVR; (0) 由 图 (a) 和 图 (全 求 和 得 到 的 锐 化 后 的 图 像 ，(h) 对 图 (g) 应 用 窜 律 变换 得 
到 的 最 终结 果 。 请 将 图 (g) 与 图 (a) 比较 ( 原 图 像 由 G. E. Medical Systems 公司 提供 ) 


一 种 方法 是 , 使 用 原 图 像 经 梯度 操作 后 的 平滑 形式 所 形成 的 一 个 模板 。 这 种 方法 的 动机 很 直接 , 并 且 


基于 3.6.1 节 中 介绍 过 的 一 阶 微分 和 二 阶 微分 的 性 质 。 拉 普 拉 斯 操作 作为 一 种 二 阶 微分 算 子 , 在 图 像 细 节 的 增 
强 处 理 方 面 有 一 定 的 优点 ， 且 在 增强 细节 方面 它 是 最 好 的 。 但 与 梯度 操作 相 比 ， 拉 普 拉 斯 操作 会 导致 更 多 的 


第 3 章 灰 度 变 换 与 空间 滤波 105 


噪声 ,这 些 噪声 在 平滑 区 域内 更 令 人 讨厌 ,因为 在 这 些 区 域 它 非常 显眼 ,梯度 变换 在 灰 度 变化 的 区 域 ( 灰 
度 斜 坡 或 台阶 ) 的 平均 响应 , 要 比 拉 普 拉 斯 操作 的 平均 响应 更 强烈 。 梯 度 操作 对 噪声 和 小 细节 的 响应 要 
比 拉 普 拉 斯 操作 的 响应 弱 ， 而 且 可 以 通过 均值 滤波 器 对 其 进行 平滑 处 理 来 进一步 降低 。 这 时 ， 思 路 是 
对 梯度 图 像 进行 平滑 处 理 ， 并 用 拉 普 拉 斯 图 像 与 它 相 乘 。 在 这 种 情况 下 ， 可 以 将 平滑 后 的 梯度 图 像 视 
为 一 个 模板 图 像 。 乘 积 会 保留 灰 度 变化 强烈 区 域 的 细节 ， 同 时 降低 灰 度 变化 相对 平坦 区 域 的 噪声 。 我 
们 可 以 认为 ， 这 种 处 理 基本 结合 了 拉 普 拉 斯 操作 与 梯度 操作 的 优点 。 把 结果 加 到 原 图 像 上 ， 就 可 以 得 
到 最 终 的 锐 化 图 像 。 

图 3.43 (d) 显示 了 原 图 像 使 用 式 (3.6-12) 给 出 的 Sobel 梯度 操作 的 结果 。 分 量 g, 和 g, 分 别 使 用 
图 3.41(d) 和 图 3.41 (e) 中 的 模板 获得 。 如 所 期 望 的 那样 ， 该 图 像 中 的 边缘 要 比 拉 普 拉 斯 图 像 中 的 边 
缘 突 出 许多 。 图 3.43 (e) 中 平滑 后 的 梯度 图 像 是 使 用 大 小 为 5 x 5 的 一 个 均值 滤波 器 得 到 的 。 为 便于 显 
示 ， 两 幅 梯 度 图 像 已 与 拉 普 拉 期 图 像 相 同 的 方式 进行 了 标定 。 因 为 梯度 图 像 的 最 小 可 能 值 是 0, tk 
标定 后 的 梯度 图 像 中 的 背景 是 黑色 的 , 而 不 是 标定 后 的 拉 普 拉 斯 图 像 中 的 灰色 。 图 3.43 (d) 和 图 3.43 (e) 
比 图 3.43 (b) 明亮 的 事实 再 次 表明 , 具有 重要 边缘 内 容 的 梯度 图 像 的 值 , 一 般 要 比 拉 普 拉 斯 图 像 的 值 高 。 

拉 普 拉 斯 图 像 与 平滑 后 的 梯度 图 像 的 乘积 显示 在 图 3.43 (A 中 。 注 意 增 强 了 边缘 ， 并 降低 了 噪声 ， 
这 是 使 用 一 幅 平 滑 后 的 梯度 图 像 来 掩 项 拉 普 拉 斯 图 像 的 关键 目的 。 将 乘积 图 像 与 原 图 像 相 加 就 产生 了 图 
3.43 (g) 所 示 的 锐 化 图 像 。 与 原 图 像 相 比 ， 该 图 像 中 大 部 分 细节 的 清晰 度 明显 增加 ， 包 括 肋骨 、 演 椎 骨 、 
骨盆 及 颅骨 。 单 独 使 用 拉 普 拉 斯 操作 或 梯度 操作 都 不 可 能 达到 这 种 程度 的 改进 。 

以 上 讨论 的 锐 化 过 程 在 感知 方面 并 未 影响 图 像 灰 度 的 动态 范围 。 因 此 ， 增 强 处 理 任务 的 最 后 一 步 
是 增 大 锐 化 后 图 像 的 动态 范围 。 如 3.2 节 和 3.3 节 中 详细 讨论 的 那样 , 有 很 多 可 以 完成 这 一 目标 的 灰 度 
变换 函数 。 从 3.3.2 节 的 结果 可 以 知道 , 对 类 似 此 处 灰 度 分 布 比较 暗 的 图 像 进 行 直 方 图 均衡 的 效果 似乎 
并 不 好 。 直 方 图 规定 化 可 能 是 一 种 解决 方法 ， 但 待 处 理 图 像 的 暗 特征 用 寡 律 变换 处 理 更 好 。 由 于 我 们 
希望 能 够 扩展 灰 度 范围 ,因此 式 (3.2-3) 中 的 y 值 必须 小 于 1。 使 用 该 式 进 行 一 些 实验 后 , 我 们 得 到 了 图 
3.43 (W 所 示 的 结果 ,此 时 y=0.5,c= 1。 将 这 幅 图 像 与 图 3.43 (e) 相 比 较 ， 可 以 看 到 图 3.43 (h) 中 出 现 了 
许多 重要 的 新 细节 。 围绕 手腕 、 手 掌 、 脚 踩 和 脚掌 的 区 域 都 是 这 种 效果 的 很 好 例子 。 人 体 的 整个 骨架 
结构 也 很 明显 ， 包 括 手臂 骨 和 腿 骨 。 我 们 还 注意 到 ， 人 体 轮廓 及 人 体 组 织 的 清晰 度 不 高 ， 这 是 由 于 在 
扩大 灰 度 动态 范围 来 显现 细节 的 同时 ,也 增 大 了 噪声 , 但 图 3.43 (h) 与 原 图 像 相 比 还 是 明显 改进 了 视觉 
效果 。 

刚才 讨论 的 方法 是 很 有 代表 性 的 处 理 方式 ， 即 要 达到 用 单 种 方法 无 法 实现 的 效果 ， 需 要 结合 
使 用 多 种 方法 。 得 到 期 望 结 果 所 用 的 方法 取决 于 具体 的 应 用 。 在 这 个 例子 中 ， 所 示 图 像 类 型 的 最 
终 用 户 很 可 能 是 放射 线 学 者 。 但 也 存在 超出 我 们 讨论 范围 的 许多 原因 ， 如 物理 学 家 就 不 依赖 于 增 
强 的 结果 来 达到 诊断 目的 。 然 而 ， 通 过 突出 某 些 细节 作为 深入 分 析 原 图 像 或 一 系列 图 像 的 线索 ， 
增强 后 的 图 像 是 非常 有 用 的 。 而 在 其 他 领域 ， 增 强 处 理 后 的 结果 可 能 就 是 最 终 的 “产品 ”。 在 印刷 
业 、 基 于 图 像 的 产品 检测 、 法 院 取 证 、 显 微 、 监 视 及 其 许多 他 领域 ， 增 强 的 主要 目的 是 得 到 具有 
较 多 可 见 细 节 的 图 像 。 


3.8 ”使 用 模糊 技术 进行 灰 度 变换 和 空间 滤波 


下 面 通过 介绍 模糊 集合 及 其 在 灰 度 变换 和 空间 滤波 中 的 应 用 来 结束 本 章 , 灰 度 变 换 和 空间 滤波 是 前 几 
节 探 讨 的 主题 。 业 已 证 明 ， 这 两 种 应 用 是 图 像 处 理 中 最 常 使 用 模糊 技术 的 领域 。 本 章 最 后 的 参考 文献 ， 提 
供 了 关于 模糊 集合 及 其 在 图 像 处 理 中 的 应 用 的 文献 。 如 我 们 在 下 面 的 讨论 中 看 到 的 那样 ， 模 糊 集合 在 解决 
那些 不 以 精确 概念 表述 的 问题 时 ， 提 供 了 整个 人 类 知识 的 框架 。 
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3.8.1 引言 


如 2.6.4 节 提 及 的 那样 ， 集 合 是 由 一 个 或 多 个 对 象 (元 素 ) 构成 的 整体 ， 集 合 论 是 处 理 集合 中 操作 
的 工具 集 。 与 数学 逻辑 一 样 , 集合 论 理所当然 也 是 经 典 数学 的 基础 之 一 。 集合 论 的 核心 是 集合 成 员 的 概 
念 。 我 们 习惯 于 处 理 所 谓 的 “干脆 ”和 集合， 它们 的 成 员 在 传统 的 二 值 布尔 逻辑 情况 下 ， 不 是 真 就 是 假 ， 
用 1 表示 真 , 用 0 表示 假 。 例 如 ， 令 2 表示 所 有 人 员 的 集合 ， 且 我 们 想 要 定义 集合 Z 的 一 个 称 为 年 轻 人 
集合 的 子 集 4。 为 了 形成 该 子 集 ， 我 们 需要 定义 一 个 隶属 度 函数 ， 它 可 以 对 Z 中 的 每 个 成 员 z 赋 一 个 1 
值 或 0 值 。 因 为 我 们 处 理 的 是 二 值 逻辑 ， 因 此 隶属 度 表 数 简单 地 定义 一 个 装 值 ， 小 于 等 于 该 阔 值 的 人 考 


虑 为 年 轻 人 ， 大 于 国 值 的 人 考虑 为 非 年 轻 人 。 图 3.44(a) 用 20 岁 的 年 龄 
阔 值 总 结 了 这 一 概念 ， 并 令 妈 ;(z) 表示 刚才 讨论 的 隶属 度 函数 。 
# ab 


Stale) J Hae) 


0 z) 0 
0 10 20 3040 son a 29 30 401 so-  © 


图 3.44 用 于 产生 (a) 一 个 “于 脆 ” 集 合 和 (b) —7 SE Ga FYI EP 


使 用 这 一 表达 ， 我 们 会 立即 面临 一 个 困难 : 年 龄 为 20 岁 的 人 被 认为 是 年 轻 人 ， 但 年 龄 为 20 岁 零 
1 秘 的 人 就 不 是 年 轻 人 集合 的 成 员 。 这 是 使 用 “Te” 集合 的 一 个 基本 问题 ， 它 在 许多 实际 应 用 中 限 
制 了 经 典 集合 论 的 用 途 。 

我 们 所 需 的 年 轻 应 是 年 轻 和 不 年 轻 之 间 的 逐渐 过 渡 。 图 3.44 (b) 显示 了 一 种 可 能 性 。 该 函数 的 关 
键 特性 是 非 限制 评价 ， 因 此 能 在 年 轻 和 不 年 轻 之 间 连 续 过 渡 。 这 就 使 得 它 可 能 具有 “年 轻 ” 的 程度 。 
现在 我 们 可 以 说 一 个 人 是 年 轻 人 (曲线 上 端的 平坦 部 分 ) 、 相 对 年 轻 的 人 (斜坡 开始 处 ) 、50% 年 轻 的 人 
(斜坡 的 中 间 )、 不 那么 年 轻 的 人 (斜坡 的 末端 ) ， 等 等 [注意 图 3.44 (b) 中 曲线 的 斜率 引入 了 什么 是 “年 
轻 ” 的 更 加 模糊 的 概念 ]。 这 些 模糊 的 声明 与 我 们 不 太 严密 地 谈论 年 龄 时 是 一 致 的 。 这 样 , 我 们 可 以 用 
模糊 逻辑 基础 解释 非 限制 评价 隶属 度 函 数 ， 并 把 使 用 它们 生成 的 集合 视 为 模糊 集合 。 这 些 概念 将 在 下 
一 节 中 正式 表述 。 


3.8.2 ”模糊 集合 论 原理 


模糊 集合 论 是 由 工 .A. Zadeh 在 40 多 年 前 的 一 篇 论文 中 引入 的 (Zadeh[1965]) 。 如 下 面 的 讨论 那样 
模糊 集合 为 处 理 不 严密 信息 提供 了 一 种 方式 。 


为 表达 给 定 应 用 中 集合 的 广泛 性 ， 





定义 我 们 采用 传统 的 模 枯 集合 表示 法 ， 即 
令 Z 为 元 素 对象) 集 ，z 表示 Z 的 一 类 元 素 ， 即 Z = {z} 。 该 集合 “| RARE SONNE 
称 为 论 域 。Z 中 的 模糊 集合 "4 由 隶属 度 函 数 ju (z) RIE, CES ZK 
元 素 相 关 的 在 区 间 [0, 1] 内 的 一 个 实数 。ju(z) 在 z 处 的 值 表示 A 中 z 的 隶属 度 等 级 。 最 接近 j(z) 的 
值 与 在 4 中 的 = 的 较 高 隶属 度 等 级 趋 于 一 致 ， 而 当 4 (z) 接近 于 0 时 , 则 相反 。“ 属 于 ”这 一 概念 在 普 
通 集 合 中 我 们 很 熟悉 ， 但 在 模糊 集合 论 中 却 有 不 同 的 含义 。 对 于 普通 集合 ,我 们 说 一 个 元 素 属于 


D 文献 中 也 使 用 术语 模糊 子 集 来 表示 4 是 Z 的 于 集 ， 但 模糊 集合 使 用 得 更 为 频繁 。 
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或 不 属于 一 个 集合 ; 而 对 于 模糊 集合 ， 我 们 说 对 于 As(z) =1 的 所 有 = 都 是 集合 的 完全 成 员 ， 对 于 


Ai(2)=0 的 所 有 z 都 不 是 集合 的 成 员 ， 而 jw(z) 的 值 介 于 0 和 1 之 间 的 所 有 z 是 集合 的 部 分 成 员 。 因 

此 ， 模 糊 集合 是 一 个 由 = 值 和 (赋予 z 成 员 等 级 的 ) 相应 隶属 度 函 数组 成 的 序 对 ， 即 
A={z,u,(z)|zeZ} (3.8-1) 

变量 连续 时 ， 该 式 中 集合 4 ATR cK. “4 2 的 值 是 离散 值 时 ， 我 们 可 以 明确 地 说 明 4 的 元 素 。 例 

如 ， 若 图 3.44 中 的 年 龄 增 量 限制 为 整数 年 ， 则 有 

A={(, 1), (2, 1), G, 1), =-, (20, 1), (21, 0.9), (22, 0.8), +++, (25, 0.5)(24, 0.4), (29, 0.1)} 

这 里 , 作为 一 个 例子 , 元 素 (22, 0.8) 表示 年 龄 22 在 集合 中 的 隶属 度 等 级 为 0.8。 年 龄 为 20 岁 和 低 于 20 

岁 的 所 有 成 员 都 是 该 集合 的 完全 成 员 ， 而 年 龄 为 30 岁 和 高 于 30 岁 的 成 员 都 不 是 集合 的 成 员 。 注 意 ， 

该 集合 的 曲线 是 图 3.44 (b) 中 曲线 上 的 离散 点 ， 所 以 uil) 完全 定义 了 4。 从 另 一 个 角度 观察 ， 我 们 发 

现 一 个 (离散 ) 模糊 集合 只 不 过 是 一 个 函数 的 点 的 集合 ， 该 函数 将 问题 域 ( 论 域 ) 中 的 每 个 元 素 映 射 为 一 

个 大 于 0 上 且 小 于 等 于 1 的 数 。 这 样 ， 我 们 通常 可 以 交替 使 用 术语 模糊 集合 和 隶属 度 函 数 。 

当 ju(z) 仅 有 两 个 值 时 , 例如 0 和 1， 隶 属 度 函 数 就 退化 成 我 们 熟悉 的 普通 (干脆 ) 集 合 4 的 特征 
函数 。 这 样 ， 普 通 集合 就 是 模糊 集合 的 一 种 特 丈 情况。 下面 ， 我 们 考虑 涉及 模糊 集合 的 几 个 定义 ， 这 
些 定义 是 普通 集合 中 相应 定义 的 扩展 。 

空 集 : MANS Z 中 的 隶属 度 函 数 等 于 零 ， 模 糊 集合 为 空 集 。 

相等 : MHAR TAH ze ZA uz) = ep (z) ， 两 个 模糊 集合 4 和 B 相 等 。 

AME: 由 4 或 NOT(4) 表 示 模 糊 集合 4 的 补 集 (NOT) ， 定 义 为 其 素 属 度 函数 是 


Ja(2)=1= 4, (2) (3.8-2) 
的 集合 ， 对 于 所 有 的 zeZ 。 
FR: 当 且 仅 当 对 于 所 有 的 ze Z ， 有 
H(z) S Lp (2) (3.8-3) 
模糊 集合 4 是 模糊 集合 B 的 子 集 。 
FR: 对 于 所 有 的 ze Z ， 两 个 模糊 集合 4 和 8 的 并 集 是 具有 素 属 度 函 数 
Hy (z) = max [144(2), Hp (z)] (3.8-4) 


的 并 集 U(OR) ， 表 示 为 4UB 或 4 OR B。 
交集 : 两 个 模糊 集合 4 M B 的 交集 是 对 于 所 有 的 ze Z, BARRERA 
H(z) = min [pz), H(z)] | (3.8-5) 
的 模糊 集合 I， 表示 为 4 门 B 或 4AND B, 

注意 ， 在 处 理 模 糊 集合 时 ， 可 使 用 熟悉 的 符号 NOT, OR 和 AND 来 分 别 表示 补 、 并 和 交 。 

例 3.18 ”模糊 集合 定义 的 说 了 明 。 

图 3.45 说 明了 前 面 的 一 些 定义 。 图 3.45 (a) 显示 了 两 个 集合 4 和 B 的 素 属 度 函 数 。 图 3.45 (b) 显示 了 集 
合 4 的 补 集 的 隶属 度 函 数 ， 图 3.45(c) 显示 了 集合 4 和 8 的 并 集 的 隶属 度 函 数 ， 图 3.45 (d) 显示 了 这 两 个 集 
合 的 交集 的 素 属 度 函 数 。 注 意 ， 这 些 图 形 是 我 们 所 熟悉 的 关于 普通 集合 的 补 集 、 并 集 和 交集 ”。 


D 读者 可 能 在 文献 中 遇 到 过 这 样 的 例子 , 例如 两 个 模糊 集合 的 交集 的 隶属 度 函 数 曲线 下 的 面积 用 阴影 表示 , 以 指出 该 操作 的 结果 。 


这 源 于 普通 集合 操作 ， 是 不 正确 的 。 在 处 理 模糊 集合 时 ， 这 仅 适 用 于 沿 着 隶属 度 函 数 本 身 的 点 。 


9 
O! 
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Q © 
as 






p- pA) = 1 = palz) 


隶属 度 








= max[A4(z), 人 AZ)] | \ 


| 
1 
1 \ 
i + pila) + min[ H(z), eale) 
1 作 交 \ 
0 z 0 J z 


图 3.45 (a) 两 个 集合 4 和 B 的 隶属 度 函 数 ;，(b)4 的 补 集 的 隶属 . 
度 函 数 ; (c)~(d) 两 个 集合 的 并 集 和 交集 的 隶属 度 函 数 


尽管 模糊 逻辑 和 概率 均 在 相同 的 区 间 [0, 1] 上 操作 , 但 这 两 种 操作 却 有 明显 的 区 别 。 考 虑 图 3.44 中 
的 例子 , 概率 的 说 法 可 能 是 “一 个 人 年 轻 的 可 能 性 是 50%”， 而 模糊 逻辑 的 说 法 可 能 是 “一 个 人 在 年 
轻 人 集合 中 的 隶属 度 等 级 是 0.5”"。 这 两 种 说 法 的 区 别 很 重要 。 在 第 一 种 说 法 中 ， 一 个 人 不 是 在 年 轻 
集合 中 ， 就 是 在 不 年 轻 的 集合 中 ; 我 们 仅 有 “50% 的 机 会 知道 这 个 人 属于 哪个 集合 。 第 二 种 说 法 预 设 
一 个 人 的 年 轻 程度 ， 在 这 种 情况 下 其 年 轻 程 度 是 0.5。 另 一 种 解释 是 说 这 是 一 个 “平均 的 ”年 轻 人 : 
不 是 真 年 轻 ， 但 也 不 是 太 接近 于 不 年 轻 。 换 名 话说， 模糊 逻辑 完全 不 是 概率 ; 它 仅仅 处 理 一 个 集合 
中 隶属 度 的 等 级 。 在 这 种 情况 下， 模糊 逻辑 这 一 概念 就 在 由 含混 和 不 精确 而 非 随机 性 表征 的 应 用 中 
找到 了 用 途 。 








一 些 常 用 的 隶属 度 函 数 
实际 中 使 用 的 隶属 度 函数 类 型 如 下 所 示 。 
三 角形 ; 
l1-(a-z)/b, a-b<z<a 
M(z)=51-(z-a)/c, a<z<atec (3.8-6) 
0, 其 他 
梯形 
l-(a-—z)/c, a-c<z<a 
1, axz<b 
PO) pepe berakit coil 
0, 其 他 
pA 


i; z>a (3.8-8) 


l-(a-z)/b, a-b<z<a 
H(z) = 
0, 其 他 
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S 形 : 
0, z<a 
(22); a<xz<b 
S(z;a,b,c)=} °°" (3.8-9) 
1-2{ =) wn hhezec 
C—a4 
1, gC 
钟 形 : i 
sebe bi z z< SIE am MCAT OA TI Ga) 
iv 人 
—S(zic,c ,C+b), z>c 
截 尾 高 斯 形 
(z-a 
ioe 7 , a-c<z<ate (3.8-11) 
0, 其 他 


通常 ， 为 简化 公式 ， 写 成 A(z) 的 形式 时 ， 隶 属 度 函 数 中 仅 含 自 变 量 z。 为 使 用 式 (3.8-10) 的 形式 ， 
我 们 把 式 (3.8-9) 作 为 一 个 例外 。 图 3.46 显示 了 刚才 讨论 的 隶属 度 函 数 的 几 个 例子 。 前 三 个 函数 是 分 段 
线性 函数 ， 接 着 的 两 个 函数 是 平滑 函数 ， 最 后 一 个 函数 是 截 尾 高 斯 函数 。 式 (3.8-9) 描述 了 一 个 重要 
UL 的 S$ 形 函数 , 我 们 在 处 理 模糊 集合 时 会 频繁 使 用 这 个 函数 。 该 式 中 5S=0.5 时 , (A z=b KARA. 
如 图 3.46(d) 所 示 ， 这 是 曲线 改变 形状 的 那个 点 。 不 难 证明 b= (a+c)/2 (见习 题 3.31) 。 在 图 3.46 (e) 
所 示 的 钟 形 曲线 中 , 六 的 值 定义 为 曲线 的 带宽 。 


i 


ab H H 
cd 
Se 1 


l 三 角形 梯形 
0.5 0.5 





3.46 对 应 于 式 (3.8-6) 至 式 (3.8-11) 的 隶属 度 函 数 
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3.8.3 ”模糊 集合 应 用 


本 节 关 注 模糊 集合 的 应 用 基础 ， 并 通过 一 些 简单 且 熟 悉 的 例子 来 说 明 这 些 概念 。 然 后 ， 我 们 
把 这 些 结果 应 用 到 3.8.4 节 和 3.8.5 节 的 图 像 处 理 中 。 这 种 说 明 方 法 有 助 于 读者 更 容易 理想 相关 的 
内 容 。 

假设 我 们 的 目的 是 用 颜色 把 给 定 的 水 果 分 为 三 类 : 生 的 、 半 熟 的 和 成 熟 的 。 假 设 观察 水 果 成 熟 的 
各 个 阶段 得 到 了 如 下 结论 : 生 的 水 果 是 绿色 的 , 半熟 的 水 果 是 黄色 的 , 成 熟 的 水 果 是 红色 的 。 标 志 绿 、 
黄 和 红 是 颜色 感觉 的 含混 描述 。 首 先 ， 这 些 标志 必须 以 模糊 形式 来 表达 ， 即 它们 须 被 模糊 化 。 这 是 通 
过 将 隶属 度 定义 为 颜色 ( 光 的 波长 ) 的 函数 来 实现 的 ， 如 图 3.47 (a) 所 示 。 在 本 文中 ， 颜 色 是 一 个 语言 学 
上 的 变量 ， 而 一 种 特定 的 颜色 (如 有 固定 波长 的 红色 ) 是 一 个 语言 学 上 的 值 。 我 们 用 隶属 度 函 数 将 语言 
学 上 的 值 z, 映射 到 区 间 [0, 1] 来 模糊 化 ， 如 图 3.47(b) 所 示 。 


ab plz) 





颜色 (HK) wes GK) Zp 


图 3.47 (a) 用 于 模糊 颜色 的 隶属 度 函 数 ; (b) 对 特定 颜色 zo 的 模糊 化 (描述 颜色 感觉 的 曲线 
是 钟 形 曲线 ; 见 6.1 节 的 例子 。 但 在 处 理 模糊 集合 时 ， 通 常 使 用 三 角形 曲线 来 近似 ) 

刚刚 解释 的 特定 问题 的 知识 可 用 如 下 形式 的 正 -THEN 模糊 规则 来 形式 化 : 
R,: IF 颜色 是 绿色 ，THEN 水 果 是 生 的 。 





OR 
R, : IF 颜色 是 黄色 ，THEN 水 果 是 半熟 的 。 


OR 
R: IF 颜色 是 红色 ，THEN 水 果 是 成 熟 的 。 


这 些 规则 描述 了 关于 该 问题 的 知识 的 总 和 ; 它们 确实 没有 超出 思维 过 程 的 形式 化 。 

该 过 程 的 下 一 步 是 寻找 一 种 使 用 输入 (颜色 ) 和 由 IF-THEN 规则 描述 的 知识 基础 来 创建 模糊 系统 的 
输出 的 方法 。 这 一 处 理 称 为 推断 或 推理 。 然 而 ,在 运用 推断 之 前 ， 必 须 处 理 每 个 规则 的 前 提 以 便 产 生 单 
个 值 。 正 如 本 节 末 尾 所 示 的 那样 ， 一 个 前 提 的 多 
个 部 分 可 由 AND 和 OR 连接 起 来 。 基 于 3.8.2 
节 的 定义 ， 这 意味 着 执行 最 小 和 最 大 操作 。 为 
简化 说 明 ， 我 们 首先 处 理 只 包含 一 个 部 分 的 前 
提 的 规则 。 

因为 我 们 处 理 的 是 模糊 输入 , 输出 本 身 也 是 
模糊 的 ,因此 须 针 对 输出 定义 隶属 度 函 数 。 图 3.48 0 10 20 30 40 50 60 70 80 90 100 
显示 了 我 们 将 在 该 例 中 使 用 的 模糊 输出 的 隶属 成 熟 度 (%) 





pee tern 2 
=| BERK. TERE, 输出 的 自 变量 是 成 热 的 ， 它 不 同 “图 3.48 ERAEN, ARRATE 


20 


于 输入 的 目 变 量 。 
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图 3.47 和 图 3.48 与 基础 规则 一 起 ， 包 含 了 所 要 求 的 与 输入 和 输出 相关 的 所 有 信息 。 例 如 ， 我 们 注 
意 到 ,“ 红 色 AND 成 熟 ” 的 表达 与 前 面 定 义 的 交集 (AND) 操 作 相同 。 在 当前 情况 下 ， 输 入 和 输出 的 隶 
属 度 函 数 的 自 变 量 是 不 同 的 ， 因 此 结果 将 是 二 维 的 。 例 如 ， 图 3.49 (a) 和 图 3.49 (b) 显示 了 红色 和 成 熟 的 
隶属 度 函 数 ,图 3.49(c) 显示 了 它们 的 二 维 关系 。 为 了 得 到 两 个 函数 间 AND 操作 的 结果 ,回忆 式 (3.8-5) 
TA, AND 定义 为 两 个 隶属 度 函 数 的 最 小 ， 即 
45 (Z, V) = min {140a (Z), mae Y)} (3.8-12) 


式 中 ， 下 标 3 表示 这 是 基础 知识 中 规则 R, 的 结果 。 图 3.49 (d) 显示 了 AND 操作 的 结果 ”。 

式 (3.8-12) 是 涉及 两 个 隶属 度 函 数 的 通 解 。 在 实践 中 ， 我 们 感 兴趣 的 是 来 自 一 个 特定 输入 的 输出 
结果 , 令 zy 表示 红色 的 一 个 特定 值 。 该 输入 的 响应 中 的 红色 分 量 的 隶属 等 级 是 简单 的 标量 值 Wesa(zo) 。 
我 们 找到 与 规则 R 和 这 个 特定 输入 对 应 的 输出 ， 即 在 wsa(zo) 和 (z, v) 间 执 行 AND 操作 ， 并 在 zo 
处 求 值 。 如 前 面 表 明 的 那样 ，AND 操作 使 用 最 小 操作 来 实现 : 

Q; (v) = min { Hva (Zo); 5 (Zo, V)} (3.8-13) 
AP, O (v) 表示 由 规则 R, 和 一 个 特定 输入 导致 的 模糊 输出 。0Q, 中 的 唯一 变量 是 所 期 望 的 输出 变量 vo 


Hv) 





图 3.49 (a) 与 红色 相关 联 的 隶属 度 函 数 的 形状 ; (b) 相应 的 输出 隶属 度 函 数 ， 两 个 函数 由 规则 
RAK; (c) 两 个 函数 组 合 在 一 起 的 表示 。 该 表示 是 二 维 的 ， 因 为 在 图 (a) 和 图 (b) 
中 的 自 变量 是 不 同 的 ; (d) 图 (a) 和 图 (b) 的 AND 操作 结果 ， 如 式 (3.8-5) 的 定义 一 样 


为 了 用 图 形 方式 解释 式 (3.8-13), 再 次 考虑 图 3.49(d) ， 该 图 显示 了 通用 函数 j4(z,v) 。 执行 一 个 正 
常数 c 的 最 小 化 操作 ， 该 函数 将 在 该 常数 之 上 裁剪 a(z, v) 的 所 有 值 ， 如 图 3.50 (a) tas. 然而 , 我 
们 只 对 沿 彩色 轴 的 一 个 值 (z0) 感 兴趣 ,因此 ,相关 的 结果 是 沿 成 熟 轴 的 截 短 函 数 的 剖面 , 该 剖面 位 


D 注意 , 式 (3.8-12) 是 由 序 对 值 {wg@@), aa 形成 的 , 回忆 可 知 , 序 对 集合 通常 称 为 笛 卡 儿 积 , H Ay RR, SEX EH ealz) 
改变 z 生成 的 值 集 { roa (21) Area (Z2); "3 Ered (zn)} vo 是 由 Anat(V) 改变 v 生成 的 类 似 值 集 。 tH, XxV= 


{ tea (21); Hina V1)» (Heed (En), Hmar(V)))， 由 图 3.49 (d) 我们 看 到 ， 涉 及 两 个 变量 的 AND 操作 可 表达 为 从 xy 到 区 间 [0, 1] BGR 
KN, RRN XXV > [0,1] 。 尽 管 我 们 在 当前 的 讨论 不 使 用 这 种 表示 ,但 这 里 提 及 它 的 原因 在 于 我 们 可 能 会 在 关于 模糊 集合 | 


的 文献 中 遇 到 它 。 
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于 zw 处 ， 如 图 3.50 (b) 所 示 [ 因为 图 3.50(a) 对 应 于 规则 RR ， 它 满足 c= pws(z0) J. 式 (3.8-13) 是 该 剖面 
的 表达 式 。 





> ae # 


图 3.50 “(a) 一 个 任意 常数 c 和 来 自 式 (3.8-12) 的 函数 y (z, v) 的 最 小 化 结果 。 
最 小 化 等 价 于 一 个 AND 操作 ; (b) 在 特定 颜色 处 的 剖面 ( 黑 线 ) 


利用 同样 的 推理 ， 我 们 可 得 到 由 其 他 两 个 规则 和 特定 输入 z 导致 的 模糊 响应 ， 如 下 所 示 : 


Q, (v) = min | Hyenow (Zo), Ha (Zo> yj (3.8-14) 
All 


Q, (V) = min {geen (20), 44 (Z0>¥)} (3.8-15) 


上 面 的 每 个 公式 都 是 与 一 个 特殊 规则 和 一 个 特定 输入 有 关 的 输出 。 也 就 是 说 ， 它 们 描绘 了 前 面 几 段 中 
提 到 的 隐 含 处 理 的 结果 。 记 住 ， 这 三 个 响应 中 的 每 个 都 是 模糊 集合 ， 即 使 输入 是 一 个 标量 值 。 

为 得 到 全 部 响应 ， 我 们 把 单个 响应 聚集 起 来 。 在 本 节 开 始 给 出 的 规则 基础 中 ， 三 个 规则 是 由 OR 
操作 联系 起 来 的 。 这 样 ， 全 部 模糊 输出 由 下 式 给 出 : 


Q=Q, OR Q, OR Q, (3.8-16) 
我 们 看 到 全 部 响应 是 这 三 个 模糊 集合 的 并 集 。 因 为 OR 定义 为 最 大 操作 ， 所 以 可 将 该 结果 写 为 


Ov) = max { min {y (zo ) H, (Zo. 可 | (3.8-17) 


式 中 ,r={1,2,3} ， 且 s = {绿色 , 黄色 , 红色 }。 尽 管 该 表达 式 是 从 一 个 例子 中 推导 出 来 的 ， 但 它 完全 
通用 ; 要 将 其 扩展 到 个 规则 的 情形 ,我 们 可 以 简单 地 令 x = {1,2,…, 友 ;类似 地 ,我们 可 以 把 扩展 
到 包括 任何 有 限 数量 的 隶属 度 函 数 的 情形 。 式 (3.8-16) 和 式 (3.8-17) 描述 了 相同 的 事情 : 模糊 系统 的 响 
应 0， 是 由 该 隐 含 处 理 每 个 规则 得 到 的 单个 模糊 集合 的 并 集 。 

图 3.51 以 图 示 方式 总 结 了 迄今 为 止 讨论 的 内 容 。 图 3.51 (a) 显示 了 在 zo 处 计算 的 三 个 输入 隶属 度 函 
数 , 图 3.51(b) 显 示 了 对 输入 及 的 响应 的 输出 。 这 些 模糊 集合 是 使 用 图 3.50 (b) 的 方法 裁剪 后 的 剖面 。 注 
意 ，Q 由 所 有 的 0 组 成 ， 因 为 Ueem(zo)=0; 也 就 是 说 ，Q 是 空 集 ， 正 如 在 3.8.2 节 定 义 的 那样 。 
3.51(c) 显示 了 最 终结 果 OQ， 它 本 身 是 一 个 由 Q,，Q, FO, 的 并 集 形 成 的 模糊 集合 。 

我 们 已 经 成 功 地 得 到 了 相应 于 特定 输入 的 完整 输出 ， 但 我 们 仍然 在 处 理 一 个 模糊 集合 。 最 后 
一 步 是 使 用 称 为 去 模糊 的 适当 处 理 ， 从 模糊 集合 O 中 得 到 一 个 “干脆 ”输出 vw。 对 O 去 模糊 得 到 
“干脆 ”输出 有 几 种 方法 。 用 得 最 多 的 一 种 方法 是 计算 该 集合 的 重心 (本章 末 尾 给 出 的 参考 文献 中 
”讨论 了 其 他 方法 ) 。 这 样 ， 若 来 自 式 (3.8-17) 的 Q(v) 及 种 可 能 的 值 O(), 0(2),…, Q(K) ， 则 其 重 
P| 心 由 下 式 给 出 : 
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K 
YQ) 
加 = 总 一 一 (3.8-18) 
220) 
v=] 


在 图 3.51(c) 中 , 用 0 的 离散 值 ? 计 算 该 公式 , 得 到 v = 72.3 ， 它 指出 给 定 的 颜色 z 意味 着 一 种 水 果 的 
成 熟 度 约 为 72%。 


RAR 


RARE 





10 20 30 40 50 60 70 80 90 100 
成 熟 度 (%) 


yQ 


隶属 度 


10 20 30 40 50 60 70 80 90 100 
成 熟 度 (%) 
图 3.51 (a) 所 选 特定 颜色 zo 的 隶属 度 函数 ; (b) 由 式 (3.8-13) 到 式 (3.8-15) 得 到 
的 单独 的 模糊 集合 ;，(c) 用 式 (3.8-16) 或 式 (3.8-17) 得 到 的 最 终 模糊 集合 


迄今 为 止 , 我 们 已 讨论 了 正 -THEN 规则 , 这 些 规 则 的 前 提 只 有 一 部 分 , 例如 “如 果 颜 色 是 红色 ”。 
包含 更 多 部 分 的 规则 必须 组 合 起 来 ， 以 便 得 出 描述 该 规则 的 整个 前 提 的 单个 数字 。 例 如 ， 假 设 我 们 
有 一 个 规则 : IF 颜色 是 红色 OR 坚固 性 是 软 的 ，THEN 水 果 是 成 熟 的 。 必 须 为 语言 学 变量 “ 软 的 ” 
定义 一 个 隶属 度 函 数 。 然 后 ， 为 获得 考虑 前 提 的 两 部 分 的 规则 的 单个 数字 ， 首 先 要 使 用 “红色 ” 隶 
属 度 函数 来 评估 一 种 给 定 的 “红色 ”输入 值 ， 然 后 使 用 “ 软 的 ”隶属 度 函 数 来 评估 一 种 给 定 的 “ 坚 
固 性 ” 值 。 因 为 两 部 分 由 OR 连接 起 来 ， 我 们 使 用 两 个 结果 值 的 最 大 值 ”?。 然 后 ， 该 值 用 于 “干脆 ” 


O 为 清楚 起 见 ， 图 3.51(c) 中 的 模糊 集合 O 显示 为 实 线 ， 但 请 记 住 ， 我 们 在 本 书 中 处 理 的 是 数字 量 ， 因 此 O 是 一 个 数字 函数 。 
© 使 用 AND 将 各 部 分 连接 起 来 的 前 提 条 件 可 使 用 最 小 操作 进行 类 似 的 计算 。 
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成 熟 输出 隶属 度 函 数 的 推断 处 理 ， 该 函数 是 与 规则 相 联系 的 函数 。 其 他 过 程 与 以 前 相同 ,就 像 下 面 的 总 


结 中 说 明 的 那样 。 
图 3.52 显示 了 使 用 两 个 输入 “颜色 和 坚固 性 ”的 水 果 例 子 。 我 们 可 使 用 该 图 和 前 述 内容 ， 把 基于 
规则 的 模糊 逻辑 应 用 中 的 主要 步骤 总 结 如 下 。- 
— LEIBA 一 2. 应 用 模糊 逻辑 操作 3. 应 用 推理 方法 (最小) 


COR = ÈK) ] 


IF ”颜色 是 绿色 OR 坚固 性 是 硬 的 ”THEN KREEMO 
颜 Bi THEN ARREN 、 










I 
1 
1 
1 
1 
1 


IF 颜色 是 黄色 OR ”坚固 性 是 中 等 硬度 的 ”THEN ”” 水 果 是 半熟 的 
于 


红色 Oo o BAN / 
i merne ork SR TEN KRUN age 


输入 1 输入 2 5. 去 模糊 


颜色 (zu) 坚固 性 (cv) 输出 (重心 ) 
ed 


图 3.52 ”说 明 用 于 实现 一 个 基于 规则 的 模糊 系统 的 五 个 基本 步骤 的 例子 : (1) 模 
糊 ; (2) 逻辑 操作 (该 例 中 仅 使 用 OR); (3) 推 断 ; (4) 聚合 ; (5) 去 模糊 


1. 模糊 输入 : 如 图 3.52 所 示 的 前 两 列 那样 。 对 于 每 个 标量 输入 ， 通 过 将 该 输入 映射 到 区 间 [0, 1]， 
在 每 个 规则 中 使 用 可 用 的 隶属 度 函 数 ， 找 到 相应 的 模糊 值 。 

.执行 任何 需要 的 模糊 逻辑 操作 : 必须 合并 前 提 各 部 分 的 输出 ， 并 使 用 最 大 或 最 小 操作 生成 单 
个 值 ， 具 体 是 用 最 大 操作 还 是 用 最 小 操作 ， 取 决 于 各 部 分 是 由 OR 连接 还 是 由 AND 连接 。 在 
图 3.52 中 ， 前 提 的 所 有 部 分 由 OR 连接 ， 因 此 全 部 使 用 最 大 操作 。 前 提 各 部 分 的 数量 和 用 于 
连接 这 些 不 同 部 分 的 逻辑 算 子 的 类 型 ， 会 因 规则 的 不 同 而 不 同 。 

3. 应 用 一 种 推断 方法 : 每 个 规则 的 前 提 的 单个 输出 用 来 提供 与 规则 相对 应 的 输出 。 对 于 推断 ， 
我 们 用 AND， 它 定义 为 最 小 操作 。 这 就 以 这 一 前 提 提 供 的 值 “ 修 剪 ” 了 相应 输出 的 隶属 度 函 
数 ， 如 图 3.52 中 的 第 三 列 和 第 四 列 所 示 。 

4. 对 来 自 步 又 3 的 模糊 集合 应 用 一 种 聚合 方法 : 如 图 3.52 中 的 最 后 一 列 所 示 , 每 个 规则 的 输出 都 
是 一 个 模糊 集合 。 必须 组 合 这 些 模糊 集合 来 产生 单个 输出 模糊 集合 。 这 里 所 用 的 方法 是 对 各 个 
输出 使 用 OR 操作 ， 因 此 采用 了 最 大 操作 。 
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5. 对 最 后 输出 的 模糊 集合 去 模糊 : 在 最 后 一 步 中 ， 我 们 得 到 了 一 个 “干脆 ”标量 输出 。 这 是 通 
过 计算 步骤 4 中 得 到 的 聚合 模糊 集合 的 重心 得 到 的 。 


当 变 量 的 个 数 很 多 时 ,实践 中 通常 使 用 方便 的 表示 方法 (变量, 模糊 集合 ) 来 将 一 个 变量 与 其 对 应 的 
隶属 度 函 数 配对 。 例如 , 规则 IF 颜色 是 绿色 , THEN 水 果 是 生 的 , 在 这 里 可 以 写 为 下 (z, 绿色 ) THEN (v, 
生 的 ) , 如 以 前 那样 , 变量 z 和 vv 分 别 表示 颜色 和 成 熟 度 , 而 绿色 和 生 的 分 别 是 由 隶属 度 函 数 oreen (z) 和 
Hyera V) 定义 的 两 个 模糊 集合 。 

通常 ， 在 处 理 M 个 IF-THEN 规则 时 ,NN 个 输入 变量 z,z,,…,zw 和 一 个 输出 变量 v， 在 图 像 处 理 
中 最 常用 的 模糊 规则 公式 有 如 下 形式 : 

IF(z,,4,,) AND (2 4,) AND…AND (zw,4w) THEN (v, B,) 
IF(z, 41) AND (z,, 42) AND--- AND (Zy, Axy) THEN (v, B,) 
ual (3.8-19) 
IF(z,, Ay,) AND (zz, Ay) AND--- AND (Zy: Aun) THEN (v, By, ) 
ELSE (v, B: ) 


OAP, A, 是 与 第 i 个 规则 和 第 7 个 输入 变量 相关 联 的 模糊 集合 ，B, 是 与 第 i 个 规则 的 输出 相关 联 的 模 


HES, 并且 我 们 已 经 假设 规则 的 前 提 分 量 由 AND 连接 。 注意 ， 我们 已 介绍 过 与 模糊 集合 Bs 相关 联 
的 ELSE 规则 。 当 前 述 规则 没有 一 个 完全 满足 时 ， 执 行 该 规则 ; 其 输出 后 面 再 解释 。 
如 前 所 述 ， 必须 计算 每 个 规则 的 前 提 的 所 有 元 素 ， 以 便 得 到 单个 标量 值 。 在 图 3.52 中 , 我 们 使 用 
了 最 大 操作 ， 因 为 规则 是 基于 模糊 OR 的 。 在 式 (3.8-19) 中 使 用 AND ， 因 此 我 们 必须 用 最 小 操作 。 在 
式 (3.8-19) 中 ,计算 第 i 个 规则 的 前 提 产 生 一 个 标量 输出 4 ， 它 由 下 式 给 出 ; 
4h=min{p4 (z;);j=1,2,--,N} (3.8-20) | 在 规则 集中 是 使 用 OR 还 是 使 用 


AND， 取 决 于 规则 被 声明 的 方式 ， 
对 于 i=1,2,…,M ,其 中 jy (z) 是 模糊 集合 4 在 第 j 个 输入 值 计算 | 而 声明 规则 的 方式 则 取决 于 手边 的 
的 未 属 度 函数 。 通 常 ， 力 称 为 第 ， 个 规则 的 强度 水 平 (或 点 火 水 平 ) 。 eee ae a eee ie 
根据 前 面 的 讨论 ， 只 是 用 于 剪 切 第 i 个 规则 的 输出 函数 的 一 个 简单 | G3.8-19) 中 使 用 了 AND. 
的 值 。 
当 THEN 规则 的 条 件 很 难 满足 时 ， 执 行 ELSE 规则 (3.8.5 节 将 给 出 一 个 如 何 使 用 ELSE 规则 的 详 
细 例 子 ) 。 当 所 有 其 他 规则 都 很 弱 时 ， 其 响应 应 该 较 强 。 在 某 种 意义 上 ,可 以 将 ELSE 规则 视 为 在 其 他 
规则 的 结果 上 执行 NOT 操作 。 由 3.8.2 节 我 们 知道 yor, 4) (2) = Mg (Z) = 1-44 (z) 。 然 后 , 在 合并 (AND) 


所 有 级 别 的 THEN 规则 中 利用 这 一 概念 ， 给 出 ELSE 规则 的 如 下 强度 水 平 : 
A, =min{l-/,;i=1,2,---,M} (3.8-21) 


我 们 看 到 ， 如 果 所 有 THEN 规则 在 “最 大 强度 ” (其 响应 为 1) 处 点 火 ， 则 ELSE 规则 的 响应 如 所 期 望 
的 那样 是 0.THEN 规则 的 响应 较 弱 时 , ELSE 规则 的 强度 增 大 ,这 是 软件 编程 中 使 用 的 IF-THEN-ELSE 
规则 的 模糊 规则 的 等 效 。 

在 前 提 中 处 理 OR 时 , 我 们 可 以 简单 地 在 式 (3.8-19) 中 用 OR 代替 AND, 并 在 式 (3.8-20) 中 用 最 大 
(max) 代替 最 小 (min) ; 式 (3.8-21) 保 持 不 变 。 尽 管 可 以 用 公式 明确 表达 更 为 复杂 的 前 提 和 由 此 导致 的 
结果 ,但 仅 使 用 AND 或 OR 开发 的 公式 是 相当 通用 的 ， 并且 广泛 应 用 于 各 种 图 像 处 理应 用 中 。 本 章 
末尾 的 参考 文献 中 包含 了 其 他 (但 很 少 使 用 ) 的 模糊 逻辑 算 子 的 定义 ， 并 探讨 了 推 斯 (包括 多 个 输出 ) 和 
去 模糊 的 其 他 方法 。 本 节 前 面 的 介绍 是 深入 了 解 这 一 主题 的 基础 。 下 两 节 将 说 明 如 何 把 模糊 概念 用 于 
图 像 处 理 。 
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3.8.4 ”使 用 模糊 集合 进行 灰 度 变换 


考虑 对 比 度 增 强 这 样 的 一 般 问题 ， 这 是 灰 度 变换 的 主要 应 用 之 一 。 我 们 可 以 用 如 下 规则 说 明 灰 度 
级 图 像 对 比 度 增强 的 过 程 : 


IF 一 个 像素 是 暗 的 ，THEN 使 它 较 暗 。 
IF 一 个 像素 是 灰 的 ，THEN 使 它 仍 是 灰 的 。 
IF 一 个 像素 是 亮 的 ，THEN 使 它 较 亮 。 


记 住 ， 它 们 是 模糊 项 ， 我 们 可 以 用 图 3.53 (a) 中 的 隶属 度 函 数 来 表示 暗 、 灰 和 亮 这 些 概念 。 

在 输出 项 中 , 我 们 可 以 将 “ 较 暗 ”考虑 为 暗 灰 度 值 的 程度 (100% 的 黑 是 暗色 调 的 极限 值 ) ， 将 “ 较 
亮 ”考虑 为 亮色 调 的 程度 (100% 的 白 是 极限 值 ) ， 将 “ 灰 的 ” 视 为 中 间 灰 度 级 中 灰 度 的 程度 。 这 里 ， 所 
谓 的 “程度 ”是 一 种 特定 灰 度 的 数量 。 例 如 ，80% 的 黑 是 非常 暗 的 灰色 。 如 图 3.53 (b) 所 示 ， 当 以 恒定 
灰 度 来 解释 被 修改 的 强度 时 ， 输 出 隶属 度 函 数 是 单一 值 (隶属 度 函 数 是 常数 ) 。 在 区 间 [0, 1] 内 ， 当 单一 
值 被 来 自 相 应 规则 的 响应 强度 裁剪 时 , 会 出 现 各 种 程度 的 灰 度 , 如 图 3.52 中 第 四 列 所 示 的 那样 (但 应 记 
住 , 如 图 中 所 示 , 这 里 仅 有 一 个 而 非 两 个 输入 ) 。 因 为 在 输出 隶属 度 函 数 中 我 们 处 理 的 是 常数 , 故 它 满 
足 式 (3.8-18) ， 即 对 于 任何 输入 z。， 输出 w 由 下 式 给 出 : 


Haark (Zo) XVa + Mgray (Z0) X Veg + Hpright (29) Xv 
Hanse (20) + gray (20) + Forig (20) 


该 式 中 分 子 和 分 母 的 和 比 式 (3.8-18) 中 的 简单 ， 因 为 输出 隶属 度 函 数 是 被 模糊 值 修改 (裁剪 ) 过 的 
常数 。 


(3.8-22) 


ab 






Meda (Z) 


0.5 





0 


v 


Va Ug vp 


图 3.53 ”基于 规则 的 对 比 度 增强 : (a) 输 入 的 隶属 度 函数 ; (b) 输 出 的 隶属 度 函 数 


模糊 图 像 处 理 的 计算 量 很 大 ， 因 为 全 部 模糊 处 理 、 所 有 规则 的 前 提 、 推 断 、 聚 集 和 去 模糊 ， 都 必须 
应 用 到 输入 图 像 中 的 每 个 像素 上 。 这 样 ， 使 用 像 式 (3.8-22) 中 那样 的 单一 值 ， 通 过 简化 推 上 新、 聚集 和 去 模 
糊 ， 可 有 效 地 减少 计算 需求 。 在 处 理 速度 最 为 重要 的 应 用 中 ， 计 算 量 的 节省 很 有 意义 。 


mac: a 





第 3 章 ” 灰 度 变换 与 空间 滤波 117 





图 3.54 (a) 低 对 比 度 图 像 ;(b) 直方 图 均衡 后 的 结果 ; (ec) 用 基于 规则 的 模糊 集合 的 对 比 度 增强 后 的 结果 


比较 图 3.54 (b) 和 图 3.54 (ce) ,我们 看 到 后 者 在 色调 上 有 相当 大 的 改进 。 例如， 注意 前 额 和 头发 中 的 细 
节 与 图 3.54 (b) 中 相同 区 域 的 对 比 。 通 过 研究 示 于 图 3.55(d) 的 3.54 (c) 的 直方 图 ， 可 很 容易 地 解释 这 种 改进 
的 原因 。 与 均衡 后 图 像 的 直方 图 不 同 ， 该 直方 图 保留 了 原 图 像 直方 图 的 基本 特征 。 然 而 ， 暗 级 别 (直方 
低 端的 几 个 高 峰值 ) 的 左 移 很 明显 ， 从 而 瞳 化 了 级 别 。 而 对 于 竞 级 别 而 言 ， 情 形 正 好 相反 。 中 间 灰 度 稍微 
地 分 离 了 一 些 , 但 与 直方 图 均衡 后 的 结果 相 比 ， 分 离 程度 要 小 很 多 。 


一- 
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图 3.55”(a)~(b) 图 3.54(a) 和 (b) 的 直方 图 ;(c) 秋 加 在 图 (a) 上 的 输入 隶属 度 函 数 ; (dd) 图 3.54(c) 的 直方 图 


性 能 上 的 这 种 改进 的 代价 是 ,加 大 了 处 理 的 复杂 性 。 当 处 理 速度 和 图 像 乔 吐 量 是 重点 考虑 的 问题 时 ,可 
采用 的 实用 方法 是 使 用 模糊 集 技术 来 决定 什么 是 看 似 能 很 好 地 平衡 图 像 的 直方 图 。 然 后 ， 使 用 更 快 的 技术 
如 直方 图 规定 化 ， 通 过 把 输入 图 像 的 直方 图 映射 到 一 个 或 多 个 用 模糊 方法 确定 的 “理想 ”直方 图 ,来 实现 类 
似 的 结果 。 


3.8.5 ”使 用 模糊 集合 进行 空间 滤波 


把 模糊 集合 用 于 空间 滤波 时 ， 基 本 方法 是 定义 一 个 邻 域 特性 ， 该 特性 “截获 ”滤波 器 支持 检测 的 

本 质 。 例 如 ， 考 虑 检测 一 幅 图 像 中 各 区 域 间 的 边缘 。 这 在 图 像 处 理 的 应 用 中 很 重要 ， 例 如 本 节 前 面 讨 

论 的 锐 化 和 第 10 章 将 要 讨论 的 图 像 分 割 等。 
我 们 可 以 开发 一 个 基于 模糊 集合 概念 的 边缘 提取 算法 :“ 如 果 一 个 像素 属于 平滑 区 ， 则 令 其 为 白 
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色 ， 否 则 令 其 为 黑色 "， 其 中 “黑色 ”和 “白色 ”是 模糊 集合 。 为 了 用 模糊 术语 表示 “平滑 区 ”这 一 概 
念 , 我 们 可 以 考虑 邻 域 中 心 处 像素 和 邻 域 像素 间 的 灰 度 差 。 对 于 图 3.56 (a) 中 的 3x3 邻 域 , 中 心 像素 ( 标 
为 xs ) 和 邻 域 的 每 个 像素 间 的 灰 度 差 形成 了 图 3.56(b) 所 示 的 3x3 子 图 像 ， 其 中 4 表示 第 i 个 邻 点 和 中 
心 点 间 的 灰 度 差 ( 即 d, =z; 一 z; ,其 中 z 为 灰 度 值 )a 4 个 IF-THEN 规则 和 1 个 ELSE 规则 的 简单 集合 
就 可 以 实现 本 段 开始 提 到 的 模糊 集合 概念 的 本 质 : 


IF d, 是 0 AND d,#£0 THEN z; 是 白色 

IF ds 是 0 AND d,f£0 THEN z 是 白色 

IF 4d 是 0 AND d, Æ0 THEN 二 是 白色 

IF dy 是 0 AND 4d, 是 0 THEN z; 是 白色 

i ELSE z 是 黑色 
其 中 ,，“0” 也 是 一 个 模糊 集合 。 每 个 规则 的 后 项 定义 一 个 
值 ， 中 心 像素 (zs ) 的 灰 度 被 映射 到 该 值 上 。 也 就 是 说 , 语 
AJ “THEN z; 是 白色 ”意味 着 位 于 模板 中 心 位 置 的 像素 的 





灰 度 被 映射 为 白色 。 这 些 规则 简单 地 表明 ， 如 果 前 面 提 到 灰 度 邻 域 

的 灰 度 差 为 0 (在 模糊 意义 下 ) ， 则 中 心 像 素 考 虑 为 平坦 区 ”图 3.56 (a) 一 个 3x3 像素 邻 域 ，(b) 中 心 像素 

域 的 一 部 分 ; 和 否则， 中 心 像素 就 考虑 为 边缘 像素 。 和 其 邻 点 间 的 相应 灰 度 差 。 为 简化 , 讨 
图 3.57 分 别 显示 了 模糊 集合 0、 黑 色 和 白色 的 可 能 论 当前 应 用 中 仅 使 用 了 dp, da, ds Ads 


的 隶属 度 函 数 ， 其 中 我 们 使 用 ZE, BL 和 WH 来 简化 表示 。 注 意 ， 对 于 一 幅 有 工 个 可 能 灰 度 级 的 图 像 ， 
模糊 集合 ZE 的 自 变量 的 范围 是 [-L+1, ZL-1]， 因 为 灰 度 差 的 范围 可 在 -(L-1) 和 (L-1) 之 间 。 另 一 方面 , 输 
出 灰 度 的 范围 如 原 图 像 中 那样 是 [0, 工 1] 。 图 3.58- 以 图 形 方式 显示 了 上 面 规 定 的 规则 ， 其 中 标 为 z; 的 
方 框 指出 中 心 像素 的 灰 度 被 映射 到 输出 值 WH 或 BL。 


0 B=) "0 L=1 
灰 度 差 KIE 





AM, mr E] 规则 4 


图 3.58 边缘 检测 的 模糊 规则 
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” 例 3.20 使 用 基于 规则 的 模糊 集合 的 空间 滤波 增强 边缘 的 说 明 。 

图 3.59 (a) 显示 了 一 幅 大 小 为 512x512 的 人 头 CT 扫描 图 像 ， 图 3.59 C) 是 使 用 刚刚 讨论 的 模糊 空间 滤 
波 方法 的 结果 。 济 主意 提取 区 域 间 边 缘 的 方法 的 效果 ， IFEK 的 轮廓 (灰色 区 域内 部 ) 。 图 像 中 的 恒定 区 域 
呈现 灰色 ， 因 为 当前 面 讨论 的 灰 度 差 接近 0 时， EN 规则 有 一 个 很 强 的 响应 。 这 些 响应 依次 裁剪 函数 
WH. 输出 (裁剪 过 的 三 角形 区 域 的 重心 ) 是 (L-1)2 和 (一 1) 间 的 一 个 常数 ,从 而 在 图 像 中 产生 了 所 看 到 的 
浅 灰 色调 。 该 图 像 的 对 比 度 可 | 以 通过 扩展 灰 度 级 来 明显 改进 。 例如 ,图 3.59(c) 是 通过 在 K = 工 -1 时 执 
行 式 (610 和 式 Q: re 最 终结 果 是 图 3.59(c) 中 灰 度 值 跨 过 从 0 到 (一 1) 
的 全 部 灰 度 级 。 a i 

































ssi zt abc 
图 3.59 (a) 人 的 头 部 的 CT 扫描 图 像 ，(b) 使 用 图 3.57 中 的 隶属 度 函数 和 
图 3.58 中 的 规则 的 模糊 空间 滤波 的 结果 ;(c) 灰 度 标定 后 的 结果 。(b) 
和 (c) 中 淡 黑 色 的 图 像 边 缘 是 为 增加 清晰 度 添加 的 ,它们 不 是 数据 的 
一 部 分 ( 原 像 由 Vanderbilt 大 学 的 David R. Pickens 博士 提供 ) 


小 结 


本 章 介绍 的 内 容 是 灰 度 变换 和 空间 滤波 当前 使 用 的 代表 性 技术 。 本 章 包 含 的 主题 都 是 根据 领域 发 
展 的 需求 选择 的 基本 材料 。 人 ge eee 但 介绍 的 技术 都 很 通用 ， 


它们 会 经 常 出 现在 本 书 的 剩余 章节 中 。 下 一 章 会 再 次 介绍 滤波 ， 但 使 用 的 是 频率 域 的 概念 。 我 们 很 忆 
Wa rn RAR. 
参考 文献 


3.1 节 中 的 内 容 来 自 Gonzalez[1986]。3.2 节 内 容 的 辅助 读物 见 Schowengerdt[1983] ，Poyton[1996] 和 
Russ[1999]。 关 于 图 像 最 佳 显示 的 内 容 ， 请 参阅 Tsujii et al.[1998] 。 关 于 直方 图 处 理 的 早期 参考 文献 有 
Hummel[1974], Gonzalez and Fittes[1977] 和 Woods and Gonzalez[1981]。Stark[2000] 详 细小 节 了 自 适 应 对 比 度 增 
强 的 直方 图 均衡 。 对 比 度 增 强 的 其 他 方法 见 Centeno and Haertel[1997] 和 Cheng and Xu[2000]。 严 谨 直 方 图 规定 
化 的 深入 阅读 材料 见 Coltuc, Bolon and Chassery[2006]。 局 部 直方 图 均衡 方法 的 延伸 内 容 见 Caselles et al.[1999] 
和 Zhu et al.[1999]。 关 于 图 像 处 理 中 局 部 统计 应 用 和 实现 的 内 容 ， 可 以 参考 Narendra and Fitch[1981]。Kim et 
al[1997] 介 绍 了 一 种 结合 梯度 处 理 与 局 部 统计 处 理 来 增强 图 像 的 有 趣 方 法 。 

关于 线性 空间 滤波 器 及 其 实现 的 其 他 读物 有 Umbaugh[2005], Jain[1989] 和 Rosenfeld and Kak[1982]。 这 些 
文献 中 还 讨论 了 排序 滤波 器 。Wilburn[1998] 也 简要 介绍 了 排序 滤波 器 。Pitas and Venetsanopoulos[1990] 中 包含 6 

了 中 值 滤波 器 和 其 他 非 线 性 滤波 器 。JEEE Transaction in Image Processing[1996] 的 一 期 特刊 中 介绍 了 非 线 性 图 


120 数字 图 像 处 理 (第 三 版 ) 


像 处 理 的 内 容 。 有 关 高 提升 滤波 的 内 容 见 Schowengerdt[1983]。 在 讨论 图 像 复原 ( 见 第 5 章 ) 和 边缘 检测 ( 见 第 
10 章 ) 时 ， 还 会 遇 到 本 章 中 介绍 的 许多 空间 滤波 器 。 

3.8 节 的 主要 参考 文献 是 由 工 . A. Zadeh 撰写 的 关于 模糊 逻辑 的 三 篇 论文 (Zadeh[1965, 1973, 1976]) 。 如 它 
们 建立 的 模糊 逻辑 及 其 应 用 基础 那样 ， 这 些 论 文 是 精心 撰写 的 ， 有 很 高 的 阅读 价值 。 关 于 模糊 逻辑 在 图 
像 处 理 中 广泛 应 用 的 综述 , 见 Kerre and Nachtegae[2000]。3.8.4 节 的 中 例子 是 以 Tizhuoosh[2000] 描 述 的 类 似 应 
用 为 基础 的 。3.8.5 节 中 的 例子 基本 上 来 自 Russo and Ramponi[1994]。 模 糊 集合 应 用 于 灰 度 变换 和 图 像 滤 波 的 
其 他 例子 请 分 别 参阅 Patrascu[2004] 和 Nie and Barner[2006]。 前 面 所 述 的 从 1965 年 到 2006 年 的 参考 文献 ， 是 
详细 研究 在 图 像 处理 中 使 用 模糊 集合 的 许多 方法 的 起 点 。 本 章 中 讨论 的 许多 方法 的 软件 实现 见 Gonzalez, 
Woods and Eddins[2004]。 


BABS HT BNR 
可 在 本 书 的 网 站 上 找到 。 该 网 站 还 包 
习题 含有 基于 本 章 内 容 的 建议 项 目 。 





太 3.1 为 了 展开 一 幅 图 像 的 灰 度 ， 使 其 最 低 灰 度 为 C、 最 高 灰 度 为 L 一 1 ， 试 给 出 一 个 单调 的 变换 函数 。 


3.2 ”a 为 正常 数 的 指数 式 e“” 对 于 构造 平滑 的 灰 度 变换 函数 非常 有 用 。 从 这 个 基本 函数 出 发 ， 构 造 具有 下 
列 图 形 形 状 的 变换 函数 。 所 示 的 常数 是 输入 参数 ， 且 你 提出 的 变换 必须 以 特定 形式 包含 这 些 参数 (为 简 
化 你 的 答案 , 第 三 条 曲线 中 不 需要 参数 工 ) 。 


s= T(r) s= T(r) s= T(r) 


A 


AB 








(a) 


3.3 x (a) 试 给 出 实现 图 3.2 (a) 所 示 的 对 比 度 拉 伸 变换 的 一 个 连续 函数 。 此 函数 不 仅 包 含 参数 m， 还 必须 
包含 参数 E， 以 便 控制 灰 度 值 由 低 向 高 变化 时 函数 的 斜率 。 该 函数 应 归 一 化 ， 以 使 其 最 小 值 和 
最 大 值 分 别 为 0 和 1。 
(b) 画 出 作为 参数 已 的 函数 的 一 组 变换 ， 固 定 值 m= 工 /4 ， 其 中 工 是 图 像 中 灰 度 的 级 数 。 
(c) 为 使 函数 如 图 3.2 (b) 的 函数 那样 有 效 地 执行 ,E 的 最 小 值 是 什么 ? 换 句 话说 ,你 的 函数 与 图 3.2(b) 
可 以 不 同 。 它 仅 有 产生 一 幅 二 值 图 像 的 相同 结果 。 假设 使 用 8 比特 图 像 进行 处 理 , 并 使 m= 128。 
另外 , & C 是 你 正 使 用 的 计算 机 中 所 能 表示 的 最 小 正 数 。 
3.4 提出 一 组 能 够 产生 4 比特 单 色 图 像 所 有 单独 比特 平面 的 灰 度 分 层 变 换 ( 例 如 ， 变 换 函 数 T(r) ， 当 > 
在 [0.7] 区 间 时 ，7() =0， 而 当 x 在 [8, 15] 区 间 时 ，7T(x) = 15， 此 函数 可 产生 一 幅 8 比特 图 像 的 第 4 比 
特 平面 图 像 ) 。 
3.5 x (a) 通常 ， 如 果 将 低 阶 比特 平面 的 一 半 设 为 零 值 ， 对 一 幅 图 像 的 直方 图 有 何 影响 ? 
(b) 如 果 将 高 阶 比特 平面 的 一 半 设 为 零 值 ， 对 一 幅 图 像 的 直方 图 有 何 影响 ? 
女 3.6” 试 解释 为 什么 离散 直方 图 均衡 技术 一 般 不 能 得 到 平坦 的 直方 图 。 
3.7 “假设 对 一 幅 数 字 图 像 进 行 直方 图 均衡 处 理 。 试 证 明 (对 直方 图 均衡 后 的 图 像 ) 进行 第 二 次 直方 图 均衡 
处 理 的 结果 ， 与 第 一 次 直方 图 均衡 处 理 的 结果 相同 。 
3.8 在 某 些 应 用 中 ， 将 输入 图 像 的 直方 图 模型 化 为 高 斯 概率 密度 函数 很 有 用 ， 高 斯 概率 密度 函数 
的 形式 为 
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_(r-my 








P(r) = Tes - 
式 中 m Fil o 分别 是 高 斯 概率 密度 函数 的 均值 和 标准 差 。 具 体 处 理 方法 是 将 m 和 oa 视 为 给 定 图 像 的 
平均 灰 度 级 和 对 比 度 。 对 于 直方 图 均衡 ， 你 所 用 的 变换 函数 是 什么 ? 
*3.9 ”假设 图 像 的 像素 值 连续 ， 用 一 个 例子 说 明 有 可 能 存在 这 样 的 情况 ， 即 由 式 (3.3-4) 给 出 的 变换 
函数 满足 3.3.1 节 中 的 条 件 (a) 和 (b) ， 但 其 反 变 换 却 不 能 满足 条 件 (a) 。 
3.10 (a) 证 明 式 (3.3.8) 中 给 出 的 离散 变换 函数 对 直方 图 均衡 处 理 满足 3.3.1 节 中 的 条 件 (a) 和 (b) 。 
x (b) 证 明 仪 在 灰 度 ,k=0,1,…, 工 -1 不 丢失 时 ， 式 (3.3-9) 表示 的 离散 直方 图 反 变换 才 满 足 3.3.1 节 


中 的 条 件 (a') 和 (b) o p,(r) pz) 
3.11 一 幅 灰 度 范围 在 [0, 1]] 内 的 图 像 的 概率 密度 函数 p, (r) 如 右 图 所 
示 。 现 对 此 图 像 进 行 灰 度 变换 ， 使 其 灰 度 分 布 为 所 示 的 p.(z) 。 > | 
假设 灰 度 值 连续 , 求实 现 这 一 要 求 的 变换 (表示 为 + 和 z 的 函数 ) 。 
太 3.12 ” 试 提出 一 种 如 3.3.3 节 中 讨论 的 局 部 增强 技术 的 局 部 直方 图 修正 
方法 。 eu z 


0.5 1 


313 有 两 幅 图 像 f(x,y) 和 g(x,y) ， 它 们 的 直方 图 分 别 为 hF hg 
给 出 根据 hy 和 有 确定 如 下 直方 图 的 条 件 ， 并 解释 如 何 获 得 每 种 情形 下 的 直方 图 : 
x (a) f(x,y)+g(x,y)o 
(b) f(xy) g(x,y) o 
(c) f(x,y) g(x,y) 。 


(d) f(x,y) +2(x,y) o 
(e) f(x,y)*2(x,y) o 
3.14 AMARRE, BENKEN. Bit 
幅 图 像 都 用 一 个 3x3 均值 模板 来 进行 模糊 处 理 。 
(a) 模糊 后 图 像 的 直方 图 还 相同 吗 ? 试 解释 原因 。 


(b) 如 果 你 的 答案 是 不 相同 ， 画 出 两 个 直方 图 。 
3.15 ”线性 空间 滤波 的 实现 要 求 在 整 幅 图 像 中 移动 模板 的 中 心 点 , 并 在 每 个 位 置 计算 模板 系数 与 该 位 置 相应 
像素 值 的 乘积 之 和 ( 见 3.4 节 ) 。 一 个 低 通 滤波 器 能 用 所 有 系数 都 为 1 的 模板 来 实现 ， 可 使 用 所 谓 的 盒 
状 滤波 器 或 移动 均值 算法 ， 该 方法 由 仅 更 新 从 一 个 位 置 到 下 一 个 位 置 变化 的 计算 部 分 组 成 。 
x (a) 以 公式 形式 给 出 一 个 nxn 滤波 器 的 算法 , 说 明 涉 及 的 计算 规律 ,以 及 用 于 围绕 图 像 移动 模板 的 
扫描 序列 。 
(b) 大 规模 执行 的 计算 量 与 盒 状 滤波 器 算法 执行 的 计算 量 的 比值 ， 称 为 计算 优势 。 在 本 例 情况 下 求 
出 计算 优势 , 并 画 出 它 与 n 的 关系 曲线 , 其 中 n>1。 由 于 这 两 种 处 理 方法 的 标定 参数 都 是 1/n”， 
因此 在 获得 计算 优势 时 根本 不 用 考虑 它 的 影响 。 假 设 图 像 有 为 0 的 外 部 边界 ， 这 个 边界 宽 到 足 
以 让 我 们 在 分 析 中 忽略 边界 的 影响 。 
3.16 x (a) 假如 采用 如 式 (3.4-2) 定 义 的 卷 积 方法 用 空间 滤波 模板 w(x,y) 对 图 像 S(x,y) 滤波 ， 其 中 模板 在 
两 个 空间 方向 上 都 小 于 图 像 。 证 明 如 下 重要 特性 : 如 果 模 板 的 系数 之 和 为 0， 则 得 到 的 卷 积 阵 
列 (被 滤波 的 图 像 ) 中 ， 所 有 元 素 之 和 也 为 0( 可 以 忽略 计算 的 不 准确 性 ) 。 另 外 ， 你 可 以 假设 图 
像 的 边界 已 用 合适 数量 的 0 填充 。 
(b) 如 果 用 式 (3.4-1) 定 义 的 相关 方法 来 实现 滤波 ， 问 得 到 的 结果 与 (a) 的 结果 相同 吗 ? 
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3.17 讨论 用 一 个 3x3 低 通 空间 滤波 器 反复 对 一 幅 数字 图 像 进行 处 理 的 结果 , 可 以 不 考虑 边界 的 影响 应 


用 5x5 滤波 器 时 有 何不 同 ? 


3.18 x(a) 在 3.5.2 节 中 谈 到 ，( 相 对 于 背景 而 言 ) 孤 立 的 暗 或 亮 像 素 团 块 , 在 它们 的 面积 小 于 中 值 滤波 器 面 


* 3.19 


3.20 


*3.21 


3.22 


3.23 


x 3.24 


ž *3.25 


积 的 一 半 时 ， 可 被 中 值 滤波 器 滤 除 (强迫 为 邻 域 的 中 值 ) 。 假 设 滤波 器 尺寸 为 nxn ，n 为 奇数 ， 
解释 为 什么 会 这 样 。 

(b) 考虑 一 幅 有 不 同 像素 团 块 的 图 像 , 假 设 一 个 团 块 中 的 所 有 点 都 要 比 背 景 亮 或 暗 ( 同 一 团 块 中 不 同 
时 存在 这 两 种 情形 ) ， 并 且 每 个 团 块 的 面积 不 大 于 好 2/2 。 请 问 n 符 合 什 么 条 件 时 ， 有 一 个 或 多 
个 这 样 的 团 块 像 (a) 中 所 说 的 那样 被 分 离 出 来 ? 

(a) 试 给 出 求 一 个 nxn 邻 域 的 中 值 的 步 又 。 

(b) 试 给 出 一 种 逐 像素 移动 邻 域 的 中 心 来 更 新 中 值 的 技术 。 

(a) 在 字符 识别 应 用 中 ,文本 页 用 图 3.2 (b) 所 示 的 阔 值 变换 函数 简化 为 二 值 图 像 。 这 遵循 如 下 
过 程 ， 即 细 化 字符 直到 它们 成 为 全 “0” 埋 景 上 的 一 串 “1”。 由 于 有 噪声 存在 ， 故 二 值 化 
和 细 化 处 理 导致 了 字符 的 断 开 ， 断 开 缝 际 宽 1~3 个 像素 。 修 复 缝隙 的 一 种 方法 是 ， 对 二 值 
图 像 使 用 均值 模板 来 模糊 ， 进 而 在 缝隙 间 连 接 非 零 像 素 。 试 求 出 能 执行 该 任务 的 均值 模板 
的 最 小 尺寸 。 

(b) 连接 缝 际 后 ,为 了 转换 回 二 值 形式 , 要 对 图 像 进行 立 值 处 理 。 根 据 你 在 (a) 中 得 出 的 答案 , 完成 
这 一 任务 目 不 再 产生 断 线 所 要 求 的 最 小 国 值 是 多 少 ? 

以 下 三 幅 图 像 是 分 别 经 尺寸 为 n=23,25 和 45 的 方形 均值 模板 处 理 后 的 模糊 图 像 。 图 (a) 和 图 

(c) 中 左下 角 的 垂直 竖 条 被 模糊 ， 但 竖 条 与 竖 条 之 间 的 分 割 仍然 很 清楚 。 然 而 , 尽管 产生 这 幅 

图 像 的 模板 要 比 处 理 图 像 (c) 的 小 得 多 ,但 图 (b) 中 的 竖 条 却 已 经 融 在 一 起 。 试 解释 这 一 现象 

的 原因 。 





(a) b) w ’ 

考虑 图 3.34 所 示 的 应 用 ， 该 应 用 的 目的 是 消除 图 像 中 比 gxg 像素 方形 包围 的 物体 小 的 目标 。 假 设 
想 要 将 目标 的 平均 灰 度 减少 为 原平 均 灰 度 的 1/10。 使 用 这 种 方法 , 那些 目标 可 以 接近 背景 灰 度 并 用 
阔 值 法 消除 。 给 出 平均 模板 的 最 小 尺寸 (奇数 ) ,该 模板 仅 对 整 幅 图 像 处 理 一 次 就 可 将 平均 灰 度 级 减 
少 到 所 希望 的 程度 。 
在 给 定 应 用 中 , 先 对 输入 图 像 使 用 一 个 均值 模板 来 减少 噪声 ， 然 后 再 用 一 个 拉 普 拉 斯 模板 来 增强 图 
像 中 的 细节 。 如 果 交 换 一 下 这 两 个 步骤 的 顺序 ， 结 果 是 否 会 相同 ? 
证 明 如 式 (3.6-3) 所 示 的 拉 普 拉 斯 变换 是 各 向 同性 的 (旋转 不 变 的 ) 。 你 将 需要 下 列 轴 旋转 9 角 的 坐 
标 方程 : 

x=x'cos@—y'sin@ 

y=x'sin@+ y'cosd 
SUP (x,y) 为 未 旋转 的 坐标 ， 而 (x',y') 为 旋转 后 的 坐标 。 
你 在 图 3.38 中 看 到 中 心 为 -8 的 拉 普 拉 斯 模板 所 得 到 的 结果 , 要 比 中 心 为 -4 的 模板 所 得 到 的 结果 清 
晰 一 些 。 详 细 说 明 其 原因 。 
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参考 习题 3.25。 

(a) 若 使 用 一 个 类 似 于 拉 普 拉 斯 的 较 大 模板 ， 如 中 心 系数 为 -24 的 5x5 模 板 ， 问 是 否 可 得 到 更 加 清 
晰 的 结果 ? 详细 解释 一 下 。 

(b) 当 该 模板 的 大 小 与 图 像 大 小 相等 时 ， 会 发 生 什么 情况 ? 

给 定 一 个 5x5 模 板 , 使 用 该 模板 来 对 一 幅 图 像 执 行 非 锐 化 模板 处 理 。 假设 均值 图 像 使 用 高 斯 滤波 器 

得 到 。 

使 用 式 (3.6-6) 给 出 的 拉 普 拉 斯 定义 , 证 明 从 一 幅 图 像 中 减 去 相应 的 拉 普 拉 斯 图 像 , 等 同 于 对 图 像 进 

行 非 锐 化 模板 处 理 。 

(a) 证 明 式 (3.6-11) 给 出 的 梯度 幅 值 是 一 种 各 向 同性 的 操作 (见习 题 3.24) 。 

(b) 如 果 使 用 式 (3.6-12) 计算 梯度 ， 证 明 其 将 失去 各 向 同性 这 一 性 质 。 

使 用 一 台 CCD 电视 摄像 机 对 某 一 区 域 进行 天 候 观 测 时 ， 每 5 分 钟 拍摄 一 次 数字 图 像 并 传送 到 中 心 

场所 。 场 景 的 照明 白天 为 自然 光 ， 晚上 为 人 造 光 ， 没 有 无 照明 的 时 间 ， 因 此 总 可 以 获得 一 幅 图 像 。 

由 于 照明 的 范围 总 是 在 摄像 机 的 线性 工作 范围 , 因此 摄像 机 本 身 并 不 需要 使 用 任何 补偿 装置 。 男 外， 

使 用 数字 技术 对 图 像 进行 后 处 理 并 归 一 化 ,就 使 得 图 像 与 恒定 照明 时 的 图 像 等 效 。 对 此 ,请 设计 一 

各 方法。 你 可 以 自由 使 用 你 希望 的 任何 方法 ， 但 必须 在 设计 中 明确 给 出 所 有 的 假设 。 


证 明 图 3.46(d) 中 的 交叉 点 由 b=(a+c)/2 给 出 。 
使 用 3.8.2 节 定 义 的 模糊 集合 和 图 3.46 中 的 基本 隶属 度 函 数 ， 形 成 下 列 隶 属 度 函 数 。 
1 1 l 
0.5 0.5 0.5 
1 
有 让 As 0 natb ec ctd * 9 a—ba=05a+b 1 * 
* (a) (b) (c) 
在 3.8.5 节 讨 论 的 模糊 滤波 方法 中 ， 增 大 邻 域 的 尺寸 会 产生 什么 影响 ”对 你 的 回答 解释 原因 (你 可 以 
用 一 个 例子 来 支持 你 的 答案 ) 。 
在 灰 度 区 间 为 [0, L-1] 的 带 噪 图像 中 ， 为 降低 脉冲 噪声 的 影响 ， 请 如 3.8.5 节 那 样 ， 设 计 一 个 基于 规 


则 的 模糊 系统 。 为 简化 问题 ， 仅 在 一 个 3x3 邻 域 中 使 用 差 值 ,da4,ds 和 必 。 在 图 像 的 任何 位 置 ， 
S z, 表示 邻 域 中 心 的 灰 度 。 相 应 的 输出 灰 度 值 应 是 z = zs +v ， 其 中 v 是 你 的 模糊 系统 的 输出 。 也 
就 是 说 ,你 的 模糊 系统 的 输出 是 一 个 用 于 减少 可 能 出 现在 该 3x3 邻 域 中 心 的 噪声 峰值 效应 的 校正 因 
Fo 假设 出 现 的 噪声 峰值 间距 大 到 无 须 关心 在 同一 邻 域内 出 现 多 个 噪声 峰值 。 这 些 峰值 可 以 是 暗 的 
或 亮 的 。 全 部 使 用 三 角形 隶属 度 函 数 。 

x (a) 给 出 该 问题 的 一 条 模糊 语句 。 

* (b) 指定 IF-THEN 规则 和 ELSE 规则 。 
(c) 如 图 3.57 那样 ， 以 图 形 方式 指定 隶属 度 函 数 。 
(d) 如 图 3.58 那样 ， 给 出 规则 集 的 图 形 表示 。 
(e) 给 出 一 个 类 似 于 图 3.52 的 模糊 系统 的 简 图 。 


z 
一 
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尽管 在 前 一 章 中 对 空间 滤波 做 了 重点 研究 , 但 如 果 不 了 解 在 图 像 滤波 中 如 何 应 用 传 里 叶 变 换 和 频率 
域 的 基本 知识 ， 要 彻底 理解 这 一 领域 也 是 不 太 可 能 的 。 即 使 读者 不 是 一 位 信号 处 理 专 家 ， 也 能 深刻 理解 
这 些 主题 ， 关 键 在 于 要 关注 基本 原理 及 它们 与 数字 图 像 处 理 的 关系 。 本 章 重点 阐述 对 初学 者 来 说 较为 困 
难 的 表示 方法 ， 并 强调 图 像 特 征 与 用 于 表示 这 些 特征 的 数学 工具 之 间 的 联系 。 本 章 主 要 为 传 里 叶 变 换 的 
基本 原理 打下 基础 ， 并 介绍 在 基本 的 图 像 滤波 中 如 何 使 用 传 里 叶 变换 。 然后, 在 第 5 章 、 第 8 章 、 第 10 
章 和 第 11 章 中 , 我 们 将 讨论 傅 里 叶 变 换 的 其 他 应 用 。 本 章 的 讨论 从 传 里 叶 变 换 的 起 源 及 其 应 用 于 数学 、 
科学 及 工程 的 众多 分 支 的 要 点 开始 。 然 后 ， 我 们 从 函数 取样 的 基本 原理 开始 ， 逐 步 推导 一 维和 二 维 离散 
传 里 叶 变 换 及 频率 域 处 理 的 要 领 。 在 这 段 阐述 中 ,我 们 还 要 接触 几 个 重要 的 取样 问题 ， 例 如 ， 混 消 ,， 这 
些 处 理 要 求 读者 对 频率 域 有 所 了 解 ， 且 在 本 章 会 多 次 涉及 。 接 下 来 是 频率 域 滤波 的 公式 表示 ， 以 及 与 第 
3 章 中 讨论 的 空间 平滑 和 锐 化 滤波 技术 相对 应 的 内 容 。 最 后 讨论 图 像 处 理 中 实现 传 里 叶 变换 的 有 关 问 题 。 
因为 4.2 节 到 4.4 节 的 内 容 是 基本 背景 知识 , 熟悉 一 维 信号 处 理 , 包括 傅 里 叶 变 换 、 取 样 、 混 消 和 卷 积 定 
理 的 读者 ， 可 直接 跳 到 4.5 节 对 二 维 传 里 叶 变换 及 其 在 数字 图 像 处 理 中 的 应 用 的 讨论 。 


4.1 背景 


4.1.1 傅 里 时 级 数 和 变换 简 史 


法 国 数学 家 吉 恩 ' 巴 普 提 斯 特 ' 约瑟夫 ' EH (Jean Baptiste Joseph Fourier) 于 1768 年 生 于 巴黎 
与 第 戎 之 间 的 奥 克 塞 里 (Auxerre) 镇 。 他 被 世人 铭记 的 最 大 贡献 记载 在 他 于 1807 年 发 表 的 传记 和 1822 
年 出 版 的 La Théorie Analitique de la Chaleur GAS} FE) 一 书 中 。 此 书 由 Freeman (参见 Freeman [1878]) 
在 55 年 后 翻译 为 英文 。 傅 里 叶 在 这 个 领域 的 贡献 是 , 他 指出 任何 周期 函数 都 可 以 表示 为 不 同 频率 的 
正弦 和 /或 余弦 之 和 的 形式 ， 每 个 正弦 项 和 /或 余弦 项 都 乘 以 不 同 的 系数 (现在 称 该 和 为 传 里 时 级 数 ) 。 
无 论 函 数 多 么 复杂 ， 只 要 它 是 周期 的 ， 并 且 满 足 某 些 适 度 的 数学 条 件 ， 都 可 以 用 这 样 的 和 来 表示 。 
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我 们 现在 认为 这 是 理所当然 的 ， 但 在 当时 ， 这 个 概念 首次 提出 后 ， 复 杂 函 数 表示 为 简单 正弦 和 余弦 之 
和 的 概念 很 不 直观 ( 见 图 4.1) ， 所 以 传 里 叶 思想 遭 到 质疑 不 足 为 奇 。 


甚至 非 周期 函数 (但 该 曲线 下 的 面积 是 有 限 的 ) 
也 可 用 正弦 和 /或 余弦 乘 以 加 权 函 数 的 积分 来 表示 。 
在 这 种 情况 下 的 公式 就 是 传 里 叶 变 换 ， 其 作用 在 多 
数理 论 和 应 用 学 科 中 甚至 远大 于 傅 里 叶 级 数 。 用 傅 
里 叶 级 数 或 变换 表示 的 函数 特征 完全 可 以 通过 传 里 
叶 反 变换 来 重建 ， 且 不 会 丢失 任何 信息 。 这 是 这 种 
表示 方法 的 最 重要 特征 之 一 ， 因 为 它 可 以 使 我 们 工 
作 于 “ 傅 里 叶 域 "， 而 且 在 返回 到 函数 的 原始 域 时 不 
会 丢失 任何 信息 。 总 之 ， 傅 里 叶 级 数 和 变换 是 解决 
实际 问题 的 工具 ， 它 作为 基础 工具 被 人 们 广泛 地 学 
习 和 利用 。 

傅 里 叶 概念 的 最 初 应 用 是 在 热 扩散 领域 ， 在 该 
领域 ， 人 们 考虑 用 微分 方程 来 表示 热流 ， 并 使 用 这 
种 方法 首次 得 到 了 结论 。 在 过 去 的 一 个 世纪 ， 尤其 
是 后 50 年 , 傅 里 叶 的 思想 使 整个 工业 和 学 术 界 都 空 
前 繁荣 。 早 在 20 世纪 60 年 代 ( 或 更 晚 些 ) ， 数 字 计 
算 的 出 现 和 快速 傅 里 叶 变换 算法 (FFT) 的 “发 现 ” 在 
信号 处 理 领 域 产生 了 巨大 变革 。 这 两 种 核心 技术 第 
一 次 允许 人 们 对 从 医学 监视 器 和 扫描 仪 到 现代 电 
子 通信 的 异常 重要 的 信号 进行 实际 处 理 。 

由 于 我 们 仅 处 理 持续 时 间 有 限 的 函数 (图像) ， 


NVA 
NWA 
DDS DLN 


图 4.1 底部 的 函数 是 其 上 面 4 个 函数 的 和 。1807 年 ， 
傅 里 叶 关 于 周期 函数 可 以 表示 为 正弦 和 
余弦 的 加 权 和 的 概念 遭 到 了 人 们 的 质疑 


所 以 傅 里 叶 变 换 是 我 们 感 兴趣 的 工具 。 下 一 节 将 介绍 伟 里 叶 变 换 和 频率 域 。 业 已 证 明 ， 传 里 叶 技术 为 
研究 和 实现 主要 的 图 像 处 理 算法 提供 了 有 意义 且 实 用 的 方法 。 在 某 些 情况 下 ， 这 些 方法 与 我 们 在 第 3 


章 中 介绍 的 方法 类 似 。 
41.2 ”关于 本 章 中 的 例子 


如 第 3 章 那 样 ， 本 章 中 的 多 数 图 像 滤 波 例 子 处 理 的 是 图 像 增强 问题 。 例 如 ,平滑 和 锐 化 与 对 比 度 
处 理 技术 一 样 ， 与 图 像 增 强 有 传统 的 联系 。 自 然 地 ， 数字 图 像 处 理 的 初学 者 会 发 现 图 像 增 强 很 有 趣 并 
很 容易 理解 。 因 此 ， 在 本 章 中 以 图 像 增强 为 例 不 仅 可 节省 本 书 额 外 的 章节 ， 而 且 能 为 初学 者 介绍 频率 
域 滤波 技术 提供 一 个 有 效 的 工具 。 在 第 5 章 、 第 8 章 、 第 10 章 和 第 11 章 中 , 我 们 将 对 其 他 应 用 使 用 


频率 域 处 理 方法 。 


4.2 基本 概念 


为 简化 本 章 的 概念 出 现 的 进程 ， 我 们 暂停 介绍 为 后 续 章 节 葛 定 基 础 的 一 系列 基本 概念 。 


4.2.1 复数 
复数 C 的 定义 如 下 : 


C=R+jl 


(4.2-1) 


222 


|224| 
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式 中 , R 和 7 是 实数 , j 是 一 个 等 于 -1 的 平方 根 的 虚数 , 即 j= V-1 。R 表示 复数 的 实 部 ，7 表 示 复 数 的 


虚 部 。 实 数 是 [= 0 的 复数 的 子 集 。 复 数 C RRAC, HENE 
C =R-jl (4.2-2) 
从 几何 角度 来 看 ， 复 数 可 视 为 平面 ( 称 为 复 平 面 ) 上 的 一 个 点 ， 其 横 坐 标 是 实 轴 (R 的 值 ) ， 其 纵 坐标 是 
虚 轴 (的 值 ) 。 也 就 是 说 ， 复 数 尺 + 这 是 复 平面 直角 坐标 系统 中 的 点 (R,D) 。 
有 时 ， 在 极 坐标 下 表示 复数 很 有 用 : 
C=|Cl(cosg+jsing) (4.2-3) 


式 中 ，|C|= VR2 +P 是 复 平面 的 原点 到 点 (R,D) 的 向 量 的 长 度 ，9 是 该 向 量 与 实 轴 的 夹 角 。 在 第 一 象 
限 中 为 向 量 画 出 实 轴 和 虚 轴 的 简 图 ， 可 显示 出 tan8 = (7/ 丸 ) 或 2 =arctan(//R). arctan 函数 返回 区 间 
[-x/2,7/2] 内 的 一 个 角度 。 然而 , 因为 T 和 RR 可 独立 为 正和 为 负 ， 因 此 我 们 需要 得 到 全 域 [-x,7] 内 的 
角度。 在 计算 9 时 ， 可 通过 简单 地 跟踪 7 了 和 RR 的 符号 来 完成 。 许 多 编程 语言 可 通过 调用 四 象限 反正 切 
元 数 来 自动 地 计算 角度 。 例 如 ，MATLAB 为 此 目的 提供 了 晴 数 atan2 (Imag, Real). 

使 用 欧 拉 公式 


el? =cos@+ jsin0 (4.2-4) 
式 中 ,e=2.718 28… ， 可 给 出 极 坐标 下 我 们 很 熟悉 的 复数 表示 : 
C=|Cle’*” (4.2-5) 


式 中 , |cl| 和 8 的 定义 如 上 。 例如 , 复数 + j2 ARER V50 ,其 中 9= 64.4° BK 1.1 弧度 (rad) 。 
前 面 的 公式 还 可 以 用 于 复 函 数 。 例 如 ， 变 量 w WARRE (u) RRK F(u) = R(w)+j7(u)， 其 中 R(u) 和 
Iu) 分 别 是 实 分 量 函 数 和 虚 分 量 函数 。 如 前 所 述 ， 复 共 思 函数 是 FF(w) = R(u)- jl (u) ， 幅 值 是 
|F(u)| = VR(u)? +7(u)”， 角 度 是 (wu) =arctan[1(u)/R(u)] 。 在 本 章 和 下 一 章 中 ， 我 们 还 会 多 次 讨论 复 
函数 。 


4.2.2 (BARK 


如 4.1.1 节 指 出 的 那样 ， 具有 周期 的 连续 变量 上 的 周期 函数 ,0 可 描述 为 乘 以 适当 系数 的 正弦 和 
余弦 之 和 。 我 们 知道 ， 这 个 和 就 是 傅 里 叶 级 数 ， 它 具有 如 下 形式 : 


oo .2 
SOY eT (4.2-6) 
式 中 ， 
1 pri2 so 
c, == f@e T dt, n=0, +1, +2, -- (4.2-7) 


T J-r/2 


是 系数 。 式 (4.2-6) 可 展开 为 正弦 与 余弦 之 和 这 一 事实 来 自 欧 拉 公式 (4.2-4) 。 在 本 章 的 后 面 ， 我 们 将 回 


到 傅 里 叶 级 数 。 
冲 激 并 不 是 通常 意义 上 的 函数 , 其 


4.2.3” 冲 激 及 : 更 准确 的 名 称 是 分 布 或 广义 函数 。 但 
其 取样 特性 E, 我们 在 文献 中 通常 会 看 到 冲 激 函 


线性 系统 和 傅 里 叶 变换 研究 的 核心 是 冲 激 及 其 取样 特性 。 连 续 变 “| 歼 、5 ARABLE 
量 1 在 1=0 处 的 单位 冲 激 表示 为 6(1) ， 其 定义 是 WR 
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©, B= 
6(t) = 二 (4.2-8a) 
它 还 被 限制 为 满足 等 式 

fi. 5(t)dt =1 (4.2-8b) 


物理 上 ， 如 果 我 们 把 解释 为 时 间 , 那么 一 个 冲 激 可 视 为 幅度 无 限 、 持 续 时 间 为 0、 具有 单位 面积 的 尖 
峰 信 号 。 一 个 冲 激 具 有 关于 如 下 积分 的 所 谓 取样 (sifting ) 特性 : 


厂 7rosod = (4.2-9) 
假设 S(O 在 1= 0 处 是 连续 的 ， 这 是 实际 中 满足 的 一 个 典型 条 件 。 取 样 


”特性 得 到 函数 f(t) 在 冲 激 位 置 (例如 ， 在 前 面 的 公式 中 为 原点 +=0) 的 | 香 字 面 上 的 意思 是 分 喇 ， 或 通过 


Bd 


一 个 筛子 分 拒 。 


值 。 取样 特性 的 一 种 更 为 一 般 的 说 明 涉 及 位 于 任意 点 的 冲 激 ,表示 为 
6(1 一 t6)。 在 这 种 情况 下 ， 取 样 特性 变 为 


fT Ot -mar= fn) (42-10) 


它 在 冲 激 位 置 处 得 到 一 个 函数 值 。 例 如 ， 如 果 f(t) =cos(t) ， 使 用 式 (4.2-10) 中 的 冲 激 S(t- n) 19) 
结 prs cos(r) = -1。 取 样 概念 的 作用 立即 变 得 很 明显 。 

令 x 表 示 一 个 离散 变量 。 单位 离散 冲 激 6(x) 在 离散 系统 中 的 作用 与 处 理 连续 变量 时 冲 激 5(0) 的 作 
用 相同 。 其 定义 如 下 : 


5(x) = f l > ; (4.2-11a) 
很 明显 ， 该 定义 也 满足 式 (4.2-8b) 的 离散 等 效 形式 : 
d(x) =1 (4.2-11b) 
离散 变量 的 取样 特性 有 如 下 形式 : 入 
f(x)6(x) = f0) (4.2-12) 
或 者 ,更 一 般 地 用 位 置 x= xo bias ini ， 
> SE- x) = f(x0) (4.2-13) 


如 前 面 一 样 , 我 们 看 到 ,取样 特性 可 简单 地 得 到 冲 激 位 置 处 的 函数 值 。 图 4.2 以 图 解 方式 显示 了 单位 离 
散 冲 激 。 与 其 连续 形式 不 同 的 是 ， 离 散 冲 激 是 一 个 普通 函数 。 
本 节 后 面 特别 感 兴趣 的 是 冲 激 串 say (t) ， 它 定义 为 无 限 多 个 离散 的 周期 冲 激 单 元 AT 之 和 : 


sar(t)= 》 6(t—nAT) (4.2-14) 


n=% 


图 4.3 显示 了 一 个 冲 激 串 。 冲 激 可 以 是 连续 的 或 离散 的 。 





àl 
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Sar(t) 





x 
0 Xo Age —BAT 2AF —AT r0 ATi}! (2AT SAT hs 


图 4.2 EF x= x 处 的 单位 离散 冲 激 。 变 量 x 是 图 4.3 一 个 冲 激 串 
离散 的 ， 任 何不 在 x=% 处 的 5 都 是 0 


4.2.4 ”连续 变量 函数 的 傅 里 时 变换 
由 Sf f (t)} 表示 的 连续 变量 上 的 连续 函数 f(t) 的 傅 里 时 变换 由 下 式 定 义 ?; 





ISO = | fe Pat (42-15) 


UP, u 也 是 一 个 连续 变量 。 因 为 t 被 积分 过 ， 故 3{f()} 仅 是 4 的 函数 。 为 了 明确 表示 这 一 事实 ， 
我 们 把 健 里 叶 变 换 写成 3{f(1)} = (1) ; 也 就 是 说 ， 为 方便 起 见 ，f (7) 的 傅 里 叶 变换 可 写 为 


F(u)= | 5 fe ?™ at (4.2-16) 
AAR, BEF), Hos Boy RRA A, BM f(1) = SF(OD} ， 写 为 
f= J F(we?™ du (4.2-17) 


这 里 , 我 们 使 用 了 这 样 一 个 事实 ， 即 在 反 变换 中 变量 jy 被 积分 过 ， 并 简单 地 写成 f(t) ， 而 不 是 更 麻烦 
地 表示 为 f) =I {F(u} o B (4.2-16) 和 式 (4.2-17) 共 同 称 为 倩 里 叶 变 换 对 。 它们 指出 了 在 4.1 节 中 
提 到 的 一 个 重要 事实 ， 即 一 个 函数 可 以 由 其 变换 来 恢复 。 

使 用 欧 拉 公 式 ， 我 们 可 以 把 式 (4.2-16) 表示 为 


F(1)= fz f(0)[cos(2nut) — jsin(2ryt)]dt (4.2-18) 


我 们 看 到 ,如 果 f/(?) 是 实数 , 那么 其 变换 通常 是 复数 。 注 意 , 传 里 叶 变 换 是 Fi) 乘 以 正弦 项 的 展 
开 ， 正 弦 项 的 频率 由 u 的 值 决定 (如 早 些 时 候 提 到 过 的 ， 变 量 : 被 积分 过 ) 。 因 为 积分 后 左边 剩 下 的 唯一 
变量 是 频率 ， 故 我 们 说 传 里 叶 变换 域 是 频率 域 。 在 本 章 稍 后 ， 我 们 将 详细 讨论 频率 域 及 其 特性 。 在 我 们 的 
Wie, t 可 以 表示 任何 连续 变量 ， 频 率 变量 H 的 单位 取决 于 1 的 单位 。 为 与 前 两 章 中 使 用 的 术语 保持 一 

例如 ， 如 果 + 表示 单位 为 秒 的 时 间 ， 则 / 的 单位 为 周 / 秒 ， 或 赫兹 (Hz) 。 | 致 , 并 在 本 章 后 面 用 于 图 像 ， 当 变量 

如 果 ; 表示 的 是 以 米 为 单位 的 距离 ， 则 / 的 单位 是 周 / 米 ， 等 等 。 换 名 | AT RP, EIS 

话说 ， 频 率 域 的 单位 与 输入 变量 的 单位 周期 无 关 。 





D 声明 传 里 叶 变换 存在 的 条 件 一 般 来 说 很 复杂 (Champeney[1987]) ,但 其 存在 的 充分 条 件 是 ft?) 的 绝对 值 或 (7?) 的 平方 的 积分 是 有 限 
的 。 实 践 中 傅 里 叶 变 换 的 存在 性 通常 不 是 问题 ， 但 理想 信号 除外 ， 因 为 这 种 正弦 信号 会 无 限 扩展 。 这 些 内 容 可 使 用 通用 的 冲 激 
函数 来 处 理 。 我 们 的 主要 兴趣 在 于 离散 傅 里 叶 变换 对 ， 它 是 所 有 有 限 函 数 存在 的 保证 ， 后 面 我 们 很 快 会 看 到 这 一 点 。 
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在 4.3 节 ， 我 们 将 利用 周期 冲 激 串 的 傅 里 叶 变 换 。 得 到 这 个 变换 并 不 像 我 们 得 到 刚才 显示 的 单个 冲 激 
的 变换 那样 简单 。 然 而 ， 理 解 如 何 推导 一 个 冲 激 串 的 变换 十 分 重要 ， 因 此 这 里 我 们 花 一 些 时 间 来 详细 推导 
它 。 我 们 从 仅 在 形式 上 与 式 (4.2-16) 和 (4.2-17) 的 指数 符号 上 有 些 不 同 的 注释 开始 。 这 样 ， 如 果 函 数 SO 
有 傅 里 叶 变 换 FU), MER 1: 求 值 后 函数 是 所 (t) ， 它 一 定 有 变换 f(y) 。 使 用 这 种 对 称 特性 和 上 面 给 出 
HURK S-t) 的 傅 里 叶 变换 erw ， 可 得 函数 e ww 的 变换 为 5CA-zi) 0 ty =a. 可 得 e 了? 的 变 
换 是 6(-j+a)=6(1-a) ， 其 中 最 后 一 步 是 正确 的 ， 因 为 5 NE ua 时 不 为 去 对 于 5(-w+a) 或 
5(U-a) ， 结 果 均 相同 ， 因 此 这 两 种 形式 是 等 价 的 。 

式 (42-14) 中 的 冲 激 串 swy() 是 周期 为 AT 的 周期 函数 ， 人 422 节 可 知 它 可 表示 为 一 个 傅 里 叶 级 数 : 


= $ Ce var 
式 中 ， 
1 cariz amy 
a ale AT/2 are Aad i 
参考 图 4.3; 我 们 看 到 区 间 [-AT/2,AT/2] Se eee ee 因此 ， tse 


EE y athe Ba gi legs RNE 
"I AT 4-ar/2 AP AT D 
然后 ， 傅 里 叶 级 数 可 展开 为 
sOi 


我 们 的 目的 是 得 到 该 表达 式 的 傅 里 叶 变 换 。 因 为 求 和 是 线性 过 程 ， 和 的 傅 里 叶 恋 换 与 求 各 个 成 分 的 伟 
里 叶 变换 之 和 是 相同 的 。 这 些 成 分 是 指数 形式 ， 在 这 个 例子 中 ， 我 们 早 些 时 候 已 确立 


e 


因此 ， 周 期 冲 激 串 sar) REE S (u) 是 


| 1 | e n 
SU) -Sloul0}=3 Se si bidie AR apd ou) 


这 个 基本 结果 告诉 我 们 , 周期 为 A7 的 冲 激 串 的 傅 里 叶 变换 仍 是 冲 激 串 , 其 周期 为 /AT o sart) MS) 之 
间 周 期 的 这 种 反比 关系 与 图 4.4 中 盒 状 函数 及 其 变换 间 的 关系 是 类 似 的 。 这 种 特性 在 本 章 的 其 余部 分 中 扮 
演 着 主要 角色 。 


4.25 #4 


在 讨论 之 前 ， 我 们 还 需要 建立 一 个 模块 。 我 们 在 3.4.2 节 介 绍 过 卷 积 的 概念 。 在 那 一 节 ， 我 们 已 
了 解 两 个 函数 的 卷 积 涉及 一 个 函数 关于 原点 翻转 (旋转 180° ) 并 滑 过 男 一 个 函数 。 在 滑动 过 程 中 的 每 一 
个 位 移 处 ， 我 们 执行 计算 ， 在 第 3 章 的 情况 下 是 计算 乘积 之 和 。 在 当前 讨论 中 ,我 们 的 兴趣 在 于 具有 
连续 变量 t 的 两 个 连续 函数 f(t) 和 h(t) 的 卷 积 ， 因 此 我 们 必须 用 积分 代替 求 和 。 像 之 前 那样 ， 这 两 个 
晴 数 的 卷 积 由 算 子 太 表示 ， 卷 积 定义 如 下 : 


f (tyke h(t) = pi fh(t -rdr (4.2-20) 
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AF, 负 号 表示 刚才 提 及 的 翻转 , t 是 一 个 函数 滑 过 另 一 个 函数 的 位 移 ， 而 z 是 积分 假 变量 。 现 在 我 们 
假定 函数 从 -co 扩展 到 oo 。 


在 图 3.4.2 中 我 们 说 明了 卷 积 的 基本 机 制 ， 且 在 本 章 稍 后 和 第 5 章 中 我 们 会 再 次 说 明 它 。 此 时 ， 
我 们 的 兴趣 在 于 寻找 式 (4.2-20) 的 傅 里 叶 变换 。 我 们 从 式 (4.2-15) 开始 : 


3{ SOHO} = | aj | re f (h(t -nd re =|" ee) J me z De Par ar 


方 括号 中 的 项 是 Mt-z) 的 傅 里 叶 变 换 。 我 们 在 本 章 稍 后 将 证 明 


以 得 到 相同 的 结果 ， 故 卷 积 满足 交换 
公式 中 利用 这 一 事实 可 得 律 。 





SORAD = [SOME ar= HW] fe dr = HUF 


回顾 4.2.4 节 , 我 们 将 1 所 在 的 域 称 为 空间 域 , 而 将 4 所 在 的 域 称 为 频率 域 ， 前 面 的 公式 告诉 我 们 ， 空 
间 域 中 两 个 函数 的 卷 积 的 傅 里 叶 变换 ， 等 于 两 个 函数 的 傅 里 叶 变换 在 频率 域 中 的 乘积 。 反 过 来 ， 如 果 
有 两 个 变换 的 乘积 , 那么 我 们 可 以 通过 计算 全 里 叶 反 变换 得 到 空间 域 的 卷 积 。 换 句 话说 ，f (1) 友 h(t) 和 
H(y)F (4) 是 傅 里 时 变换 对 。 这 一 结果 是 卷 积 定理 的 一 半 ， 并 可 写 为 

f (DAN > HF (un) (4.2-21) 
ATA PHBA A eA BY eA ET ES, ARIAS it 
HAT PETAR EY fi ES BY 

遵循 类 似 的 推导 ， 可 得 到 卷 积 定理 的 另 一 半 : 


f(A) > HKF (pi) (4.2-22) 


它 说 明 频 率 域 的 卷 积 类 似 于 空间 域 的 乘积 ， 两 者 分 别 与 傅 里 叶 正 、 反 变换 相 联系 。 如 本 章 稍 后 提 及 的 
那样 ， 卷 积 定理 是 频率 域 滤波 的 基础 。 


4.3 ”取样 和 取样 函数 的 传 里 时 变换 


本 节 利 用 4.2 节 的 概念 系统 地 阑 述 取样 的 数学 基础 ， 首 先 介绍 基本 原理 ， 然 后 介绍 取样 函数 的 传 
里 叶 变换 。 


4.3.1 取样 


用 计算 机 处 理 之 前 ， 连 续 函 数 必须 转换 为 离散 值 序列 。 如 2.4 节 介 绍 的 那样 ， 这 是 用 取样 和 量化 
来 完成 的 。 在 下 面 的 讨论 中 ， 我 们 将 详细 介绍 取样 。 

参考 图 4.5， 考 虑 一 个 连续 函数 f(t) ， 我 们 希望 以 自 变量 t 的 均匀 间隔 ( A7T RPE. RIEGER 
关于 + 从 一 % 扩 展 到 ww。 如 4.2.3 节 讨 论 的 那样 ,模拟 取样 的 一 种 方法 是 ， 用 一 个 AT 单位 间隔 的 冲 激 
串 作 为 取样 函数 去 乘 以 f(t) ， 即 


FO = SOs O= >》 SON-T) (4.3-1) 
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RF, f (0) 表示 取样 后 的 函数 。 这 个 和 式 的 每 个 成 分 都 是 由 该 冲 激 位 置 处 OREU, 3 
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如 图 4.5(c) 所 示 。 每 个 取样 值 由 加 权 后 的 冲 激 “ 强 度 ” 给 出 ， 我 们 可 通过 积分 得 到 它 。 也 就 是 说 ， 序 列 中 
的 任意 取样 值 六 由 下 式 给 出 : 按 AT 单位 间隔 取样 表明 取样 率 


的 等 于 1/AT 。 如 果 AT 的 单位 为 秒 ， 
= | OU EAT HE (4.3-2) | 则 采样 率 的 单位 是 取样 数 / 秒 。 如 果 


AT 的 单位 是 米 ， 则 取样 率 的 单位 是 
式 中 ， 我 们 利用 了 式 (4.2-10) 中 5 的 取样 特性 。 式 (4.3-2) 对 任何 整数 | 取样 数 / 米 ， 以 此 类 推 。 


大 =…, 一 2, 一 1,0,1,2,… 都 成 立 。 图 4.5(d) 显示 了 结果 ， 它 由 原始 函数 的 
等 间隔 取样 组 成 。 





f(D 


[= 








SA7(D) 





‘++ “QAP =APOOAT 267 "4 
f(Dsar(?) 





“A AT2AT 0 
fr = f(KAT) 





ee 


图 4.5 (a) 一 个 连续 函数 ; (b) 用 于 模拟 取样 过 程 的 冲 激 串 ; (c) 图 (a) 和 图 b) 相 乘 形成 的 取样 后 的 函数 ; 
(d) 由 积分 并 使 用 冲 激 的 取样 特性 得 到 的 取样 值 [ 图 (c) 中 的 虚线 仅 供 参 考 ， 它 不 是 数据 的 一 部 分 ] 


4.3.2 ”取样 函数 的 傅 里 时 变换 


令 F (uw) 代表 连续 函数 f(t) 的 傅 里 叶 变换 。 如 前 节 讨 论 的 那样 ， 取 样 后 的 相应 函数 (1) EP) 与 
一 个 冲 激 串 的 乘积 。 H 4.2.5 节 的 卷 积 定理 可 知 , 空间 域 两 个 函数 乘积 的 传 里 叶 变换 是 两 个 函数 在 频率 
域 的 卷 积 。 这 样 ， 取 样 后 的 函数 f(t) 的 传 里 叶 变换 F (ya) 是 


F(u) = HAO} = S{FOsqrO} = FURS) (4.3-3) 
其 中 ， 由 例 4.2 可 知 


a oe 
sw D ofu- (4.3-4) 
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EPRE sar (t) 的 傅 里 叶 变 换 。 由 式 (4.2-20) 中 的 定义 ， 可 直接 得 到 F (u) 和 S(y) 的 卷 积 : 


F(u) = F(u)®S(u) = f “FOS -r)dr 
1 = n 1 cd a 2 
ap) POD Aare ge ara A Fee lar (4.3-5) 


1] $ n 
a era) 
式 中 ， 最 后 一 步 来 自 于 由 式 (4.2-10) 给 出 的 冲 激 取样 特性 。 

式 (4.3-5) 中 最 后 一 行 的 求 和 表明 , 取样 后 的 函数 f(t) 的 傅 里 叶 变 换 F (u) FF (x) 的 一 个 副本 的 无 限 、 
周期 序列 ， 也 是 原始 连续 函数 的 传 里 叶 变换 。 副 本 间 的 间隔 由 J/AT 的 值 决定 。 很 明显 ， 虽 然 f (0) 是 取样 
后 的 函数 ， 但 其 变换 请 (j) 是 连续 的 ， 因 为 它 由 (4) 的 几 个 副本 组 成 ， 所 以 (1) 是 一 个 连续 函数 。 

图 4.6 是 前 面 结果 的 图 示 总 结 "。 图 4.6(a) 是 函数 f(t) 的 傅 里 叶 变换 F(u) 的 简 图 ， 图 4.6(b) 显示 
了 取样 后 的 函数 的 变换 F(u) 。 如 前 节 提 到 的 那样 ，1/AT 是 用 于 生成 取样 后 的 函数 的 取样 率 。 因 此 ， 
在 图 4.6(b) 中 ,取样 率 要 足够 高 ， 以 便 在 各 个 周期 之 间 提 供 有 效 的 间隔 ， 并 保持 (uo) 的 完整 性 。 在 
图 4.6(c) 中， 取样 率 刚好 足以 保持 F(x) ， 但 在 图 4.6(d) 中 ， 取 样 率 低 于 保持 不 同 F (2) 副本 的 最 小 取 
样 率 要 求 ， 因 此 不 能 保持 原始 变换 。 图 4.6 (b) 是 对 信号 过 取样 后 的 结果 ， 图 4.6(c) 和 (d) 分 别 是 对 信和 号 
临界 取样 和 从 取样 后 的 结果 。 这 些 概念 是 下 一 节 内 容 的 基础 。 


F(a) 


a 
b 
Ç 
d 








-2/AT ~1/AT 0 1/AT 2/AT 





—2/AT  —1/AT 0 1/AT 2/AT 
F(u) 
H 
-3/AT -2/AT -1/AT 0 1/AT 2/AT 3/AT 


图 46 人 ) 一 个 带 限 函数 的 埔里 叶 变换 ，(b)~(d) 分 别 在 过 取样 、 临 界 取样 、 欠 取样 条 件 下 取样 后 的 函数 的 傅 里 叶 变 换 


D 为 清楚 起 见 ， 图 4.6 中 傅 里 叶 变 换 的 草图 及 本 章 中 的 其 他 类 似 图 形 ， 忽 略 了 变换 一 般 是 复 函 数 这 一 事实 。 
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4.3.3 ”取样 定理 


2.4 节 简 单 地 介绍 了 取样 的 概念 。 现 在 我 们 考虑 形式 上 的 取样 过 程 ， 并 明确 一 个 连续 函数 完全 可 
由 其 取样 集合 来 恢复 的 条 件 。 

对 于 以 原点 为 中 心 的 有 限 区 间 (带宽 ) [— Har Hna | 之 外 的 频率 值 ， 其 傅 里 叶 变换 为 零 的 函数 (1) 
称 为 带 限 函 数 。 图 4.7(a) 就 是 这 样 一 个 函数 ， 它 是 图 4.6(a) 的 一 个 放大 部 分 。 类 似 地 ， 图 4.7 (b) 是 
图 4.6 (c) 所 示 临 界 取样 后 函数 的 傅 里 叶 变换 的 详细 视图 。 较 低 的 /AT (ADAG SEB Fe) 中 的 周期 融合 ， 
较 高 的 1/AT 值 在 周期 之 间 会 提供 更 为 清晰 的 间隔 。 

如 果 能 从 F(j) 中 包含 的 这 个 函数 的 副本 的 周期 序列 中 分 离 出 下 (4 的 一 个 副本 , 就 可 以 从 取样 后 
的 版 本 复原 /(D), 其 中 户 (yi) 是 取样 后 的 函数 (7) 的 待 里 叶 变 换 。 回 顾 前 节 的 讨论 , P(e) 是 周期 为 VAT 
的 连续 周期 函数 。 因 此 ， 我 们 需要 一 个 完整 的 周期 来 表征 整个 变换 。 这 意味 着 我 们 用 傅 里 叶 反 变换 从 
一 个 单 周期 就 可 恢复 f (0). 

若 副 本 间 的 间距 足够 大 ( 见 图 4.6) , 则 有 可 能 从 FF(j) 中 提取 单个 周期 使 其 等 于 下 (1) o 根据 图 4.7(b) , 
Æ V2AT > ju 或 

1 
a >2 Aiz (4.3-6) 

则 可 保证 有 足够 大 的 间距 。 该 式 指 出 ， 如 果 以 超过 函数 最 高 频率 的 两 倍 的 取样 率 来 获得 样本 ， 连 续 带 
限 函 数 能 完全 由 其 样本 集 恢复 。 这 个 结论 就 是 众所周知 的 取样 定理 7。 基于 这 一 结果 , 我 们 可 以 说 , 若 
一 个 连续 带 限 函数 用 取样 率 大 于 函数 最 高 频率 两 倍 的 取样 来 表示 ， 则 不 会 有 信息 损失 。 反 之 ， 我 们 也 
可 以 说 ， 以 LAT7 的 取样 率 对 一 个 信号 取样 的 最 大 频率 是 
Hax =1/2AT 。 有 时 , 奈奈 斯 特 取 样 率 对 于 完美 函数 的 恢复 是 充分 的 ， | 率 ， 称 为 大 奎 斯 特 取样 率 。 
但 也 存在 导致 问题 的 情况 ， 如 我 们 稍 后 在 例 4.3 中 说 明 的 那样 。 这样， 
取样 定理 就 规定 了 取样 率 必须 超过 奈奈 斯 特 取样 率 。 


F(u) ab F(p) 





H max 0 H max 


-1 0 Pi 1 
2AT 2AT AT 
图 4.7 (a) 一 个 带 限 函 数 的 变换 ，(b) 对 同一 函数 做 临界 取样 得 到 的 变换 


Fa TS SLL TUTA Fue) 复原 F (ye) , 考虑 图 4.8, 该 图 显示 了 一 个 以 略 高 于 奈 奎 斯 特 取样 率 
取样 后 的 函数 的 健 里 叶 变换 。 图 4.8 (b) 中 的 函数 由 下 式 定义 : 


AT, —Hmax < HS Hmax 


(4.3-7) 
0, 其 他 


nm-| 


先 提出 。 同 样 来 自 贝 尔 实验 室 的 Claude E. Shannon ( 克 劳 德 * E - 山 农 于 1949 年 正式 地 证 明了 该 定理 。 早期 数字 计算 系统 和 现 { 避 通信 


向 D 取样 定理 是 数字 信号 处 理 理论 的 基石 。 该 定理 由 Hary Nyquiist( 哈 里， 奈奈 斯 特 ， 美 国 贝尔 实验 室 的 一 位 科学 家 和 工程 师 ) 于 1928 年 最 
oa 的 出 现 ， 使 得 人 们 开始 研究 处 理 数字 (取样 后 的 ) 数据 的 方法 ， 从 而 导致 了 人 们 于 20 世纪 40 年 代 后 期 重新 开始 关注 取样 定理 。 
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当 乘 以 图 4.8 (a) 中 的 周期 序列 时 ,该 函数 就 分 隔 了 以 原点 为 中 心 的 周期 。 
然后 ， 如 图 4.8(e) 所 示 , 通过 五 (1) 和 (jy) ARRIVE F) : 中 的 1/A7 。 , è 

F(u) = H(u)F(w) (4.3-8) 
一 旦 得 到 了 F(x) ， 就 可 以 用 传 里 叶 反 变换 来 复原 .FiD) : 





式 (4.3-7) 中 的 AT 抵消 了 式 (4.3-5) 


fð= | © Fe du (4.3-9) 


式 (4.3-7) 到 式 (4.3-9) 从 理论 上 证 明了 ， 以 函数 包含 的 最 高 频率 的 两 倍 的 速率 取样 得 到 的 函数 的 样本 ， 
来 恢复 一 个 带 限 函 数 是 可 能 的 。 如 下 一 节 将 要 讨论 的 那样 ， 了 (1) 必须 是 带 限 的 这 一 要 求 ， 通 常 意味 着 
f(t) 必须 从 -oo 扩展 到 oo ,实际 上 这 一 条 件 并 不 满足 。 正 如 稍 后 将 要 看 到 的 那样 ， 限制 一 个 函数 的 持 
续 时 间 会 妨碍 该 函数 的 完美 复原 ， 除 非 情况 特殊 。 


-~ F(u) 
- 






—2/AT —1/AT 1/AT 2/AT 





H 


一 max 0 Bmax 


图 4.8 使 用 一 个 理想 低 通 滤波 器 提取 一 个 带 限 函 数 的 变换 的 一 个 周期 


函数 H (u) 称 为 低 通 滤波 器 , 因为 它 通过 频率 范围 低 端的 频率 , 但 会 消除 ( 滤 除 ) 所 有 较 高 的 频率 。 
它 还 被 称 为 理想 低 通 滤波 器 ， 因 为 它 在 幅度 上 无 限 快速 地 过 渡 (在 位 置 -ws 处 , 在 0 和 AT7 之 间 ， 而 
在 位 置 was 处 正好 相反 ) ， 其 特性 用 物理 电子 元 件 是 不 能 实现 的 。 我们 可 以 用 软件 来 模拟 理想 滤波 侨 ， 
但 像 在 4.7.2 节 中 解释 的 那样 ， 尽管 这 样 , 也 存在 限制 。 在 本 章 后 面 , 我们 还 会 叙述 更 多 有 关 滤波 器 的 
内 容 。 因 为 滤波 器 是 从 函数 的 取样 来 恢复 (重建 ) 原 始 函数 的 手段 ， 因 此 刚刚 讨论 的 用 于 此 目的 的 滤波 
器 称 为 重建 滤波 器 。 


4.3.4 iia 


此 时 一 个 合理 的 问题 是 : 如果 一 个 带 限 函数 用 低 于 其 最 高 频率 的 两 倍 取样 率 取样 ， 将 会 发 生 
什么 情况 ?这 相当 于 前 一 节 中 讨论 的 欠 取 样 情况 。 图 4.9 (a) 与 图 4.6(d) 相同 ,说 明了 这 一 情况 。 
以 低 于 奈 硅 斯 特 取 样 率 取样 的 最 终 效 果 是 周期 重 倒 ， 且 不 管 使 用 什么 滤波 器 ， 都 不 可 能 分 隔 出 变 
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换 的 单个 周期 。 例 如 ， 使 用 图 4.9(b) 中 的 理想 低 通 滤波 器 ， 将 会 得 到 如 图 4.9(c) 所 示 的 一 个 变换 ， 该 
变换 已 被 来 自 邻 近 周期 的 频率 破坏 。 然 后 ， 反 变换 会 产生 t 的 一 个 破坏 了 的 函数 。 由 函数 欠 取 样 导 致 
的 这 种 效果 就 是 我 们 熟知 的 频率 混淆 ， 或 简称 为 混淆 。 字 面 上 ， 混 消 是 一 个 过 程 ， 在 这 一 过 程 中 , 连 
续 函 数 的 高 频 成 分 在 取样 后 的 函数 中 被 低频 “化 妆 ” 了 。 这 与 通常 所 用 的 混 消 一 词 是 一 致 的 ， 意 思 都 
是 “ 错 认 了 ”。 


F(p) 


< 


—3/AT -2/AT -1/AT! O md AT ea AG AE 





| 
[i 1 
1 | 
! H(p) | 
| 1 
| 1 


AT 





m 
e 一 max 0 Bmax 


图 4.9 (a) 一 个 欠 取 样 带 限 函数 的 傅 里 叶 变换 (图 中 来 自 邻近 周期 的 干扰 显示 为 虚线 ) ; (b) El 4.8 (b) 中 
所 用 的 同一 个 理想 低 通 滤波 器 ; 〈c) 图 (a) 和 图 (b) 的 乘积 。 来 自 邻 近 周期 的 干扰 导致 了 混淆 ， 而 
混 清 妨 碍 了 F) 的 完美 复原 ， 并 因此 妨碍 了 原始 带 限 连续 函数 的 完美 复原 。 请 与 图 4.8 比较 


遗 城 的 是 ， 除 了 下 面 提 到 的 某 些 特殊 情况 外 ， 在 取样 后 的 函数 中 ， 混 消 总 是 存在 的 ， 尽 管 原始 取 
样 后 的 函数 是 带 限 的 ， 实 践 中 我 们 必须 限制 函数 的 时 间 ， 而 在 我 们 限制 函数 的 持续 时 间 时 ， 总 会 引进 
无 限 的 频率 成 分 。 例 如 ,假设 我 们 想 要 把 带 限 函 数 O 的 持续 时 间 限制 在 区 间 [0, TAY FRAT AT ALE £ (0) 
乘 以 如 下 函数 来 达到 : 


if 0< ts T 
h(t) = 其 他 (4.3-10) 


这 个 函数 具有 与 图 4.4 (a) 相同 的 基本 形状 ,其 变换 五 (j) 具有 无 限 扩展 的 频率 成 分 ， 如 图 4.4(b) 所 示 。 
由 卷 积 定 理 可 知 ， 乘 积 A(t) f(t) 的 变换 是 这 两 个 函数 的 变换 的 卷 积 。 虽 然 (i) 的 变换 是 带 限 的 ， 将 该 
变换 与 及 (1) 卷 积 ， 它 包含 在 另 一 个 函数 上 滑动 一 个 函数 的 过 程 ， 这 就 产生 了 一 个 频率 成 分 无 限 扩展 
的 结果 。 因 此 ， 没 有 有 限 持续 时 间 的 函数 是 带 限 的 。 反 过 来 ， 带 限 函 数 一 定 从 -oo 扩展 到 oo ”。 
根据 前 一 段 说 明 的 原因 ， 我 们 断定 ， 用 有 限 长 度 的 取样 和 记录 工作 ,混淆 将 不 可 避免。 在 实 
践 中 ， 可 以 通过 平滑 输入 函数 减少 高 频 成 分 的 方法 (如 对 图 像 采用 散 焦 方法 ) 来 降低 混淆 的 影响 。 


D 一 个 重要 的 特例 是 当 一 个 从 - 00 扩展 到 co 的 函数 是 带 限 的 周期 函数 时 。 此 时 ， 该 函数 可 被 截断 并 且 仍 是 带 限 的 ， 前 提 是 该 截断 
精确 包含 整数 个 周期 。 单 个 截断 的 周期 (及 函数 ) 可 由 一 组 满足 取样 定理 并 在 截断 的 区 间 上 获得 的 离散 样本 来 表示 。 
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这 种 处 理 称 为 抗 混淆 ， 它 必须 在 函数 被 取样 之 前 完成 ， 因 为 混淆 是 一 个 取样 问题 ,而 取样 问题 不 能 使 
用 计算 技术 “事后 取消 ”。 


例 4.3 混淆。 i 
图 4. De A 在 两 个 方向 上 无 限 扩展 的 纯正 弦 波 具有 单一 频率 ， 因 此 它 很 明显 


是 带 限 的 = Rei ene (现在 忽 咯 图 PUA 用 式 sin(nt) 来 表示 ， 
ZIE V otto Ba Ltd ete 101,23, -处 与 时 间 轴 





GA cine 显然， renner SPA) 的 取样 率 对 信号 取 
HE, 在 t=… -001,23 处 得 到 的 样本 是 …sin(-m) ,sin(0) ,sin(m) ,sin(2z),…， 它 们 都 是 零 。 这 说 明了 取 
样 定理 要 求 取样 率 超过 信号 最 高 频率 两 售 的 原因 ， 就 像 前 面 提 及 的 那样 。 


图 4.10 中 的 大 黑 点 ee eR este 














图 4.10 混淆 的 说 明 。 从 取样 后 的 函数 ( 黑 点 ) 看 上 去 像 一 个 频率 比 连续 信号 频率 低 得 多 的 正弦 
波 。 该 正弦 波 的 周期 是 2s， 因 此 与 水 平 轴 的 零 交 又 每 秒 出 现 一 次 ，AT 是 样本 间隔 


43.5 由 取样 后 的 数据 重建 (复原 ) 函数 


本 节 说 明 由 一 组 样本 集合 来 重建 函数 实际 上 可 以 减少 样本 间 的 内 插 。 即 使 简单 地 用 显示 介质 显示 一 幅 
图 像 的 行为 ， 都 要 求 来 自 其 样本 的 图 像 重 建 。 因 此 ， 理 解 取样 数据 重建 的 基础 是 很 重要 的 。 卷 积 是 这 一 理 
解 的 核心 ， 因 而 再 度 表 明了 这 一 概念 的 重要 性 。 

图 4.8 和 式 (4.3-8) 的 讨论 概括 了 一 个 带 限 函数 使 用 频率 域 方法 由 其 样本 完美 复原 的 过 程 。 使 用 卷 
积 定理 ,我 们 可 以 在 空间 域 得 到 等 价 的 结果 。 从 式 (4.3-8) ，F(UOD) =H (DF), A 


SO =S {FUD} = I {HUD} = hO*FO (43-11) 
式 中 ， 最 后 一 步 来 自 式 (4.2-21) 的 卷 积 定理 。 可 以 证 明 ( 见 习题 4.6) ， 将 式 (4.3-1) 给 出 的 了 (7) 代入 
式 (4.3-11) ， 然 后 使 用 式 (4.2-20) ， 可 导出 f(t) 的 如 下 空间 域 表达 式 : 


f= y f(nAT)sine[(t—nAT)/AT] (4.3-12) 


n=-2 
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AP, sinc 函数 由 式 (4.2-19) 定 义 。 这 个 结果 并 不 意外 ， 因 为 盒 状 滤波 器 五 (5) 的 傅 里 叶 反 变换 是 一 个 
sinc 函数 ( 见 例 4.1) 。 式 (4.3-12) 表明， 完美 重建 的 函数 是 用 取样 值 加 权 的 sinc 函数 的 无 限 和 ， 并 且 具 
有 一 个 重要 特性 ， 即 重建 的 函数 恒 等 于 在 多 个 AT7 的 整数 增 量 处 的 样本 值 。 也 就 是 说 ， 对 于 任何 
t=kAT ,其 中 上 是 整数 ，f(t) 等 于 第 个 样本 f(kAT) 。 这 来 自 式 (4.3-12) ,因为 sinc(0)=1, 并 且 对 
于 任何 其 他 整数 m，sinc(m) = 0。 样 本 点 之 间 的 f(z) 值 是 由 sine 函数 的 和 形成 的 内 插值 。 

式 (4.3-12) 要 求 样本 间 的 内 插 有 无 限 多 项 。 在 实际 中 ， 这 意味 着 我 们 必须 找到 一 种 样本 间 内 插 有 
限 的 近似 方法 。 如 我 们 在 2.4.4 节 中 讨论 的 那样 , 在 图 像 处 理 中 使 用 的 主要 内 插 方法 是 最 近邻 法 、 双 线 
性 法 和 双 三 次 内 插 法 。 在 4.5.4 节 中 ， 我 们 将 讨论 图 像 内 插 的 效果 。 


44 ” 单 变量 的 离散 传 里 叶 变 换 (DFT) 


本 节 的 主要 目的 是 从 基本 原理 开始 推导 离散 传 里 叶 变换 。 迄 今 为 止 的 内 容 可 视 为 这 些 基 本 原理 的 
基础 ， 因 此 现在 我 们 适当 地 推导 DFT 所 必需 的 工具 。 
4.4.1 由 取样 后 的 函数 的 连续 变换 得 到 DFT 


如 4.3.2 节 讨 论 的 那样 , 一 个 取样 过 的 、 带 限 的 、 扩 展 到 -= 到 mm 范围 的 函数 的 傅 里 叶 变 换 ， 也 是 
扩展 到 -到 mm 范围 的 连续 的 周期 函数 。 实 践 中 ， 我 们 处 理 有 限 数量 的 样本 ， 因 此 本 节 的 目的 是 推导 
对 应 于 这 种 样本 集合 的 DFT。 


式 (4.3-5) 给 出 了 关于 原始 函数 变换 的 取样 过 的 数据 的 变换 F(a) ,但 未 给 出 采样 后 函数 SO 
本 身 的 变换 FA) 的 表达 式 。 我 们 直接 由 式 (4.2-16) 中 给 出 的 传 里 叶 变 换 的 定义 寻找 这 样 一 个 表 
达 式 : 


F=f" Fe war (44-1) 
用 式 (4.3-1) 代 替 e, BI 


F(u)= i Je d= A > Sf (t)5(t-nAT )e?™ dt = ot | a f (D5(t—nAT)e P™ dt 


wo 
= —j2npnAT 
= > FE 


n=- 


(4.4-2) 


sth, 最 后 一 步 来 自 式 (4.3-2) 。 虽 然 三 是 离散 函数 , 但 如 我 们 由 式 (4.3-5) 所 知道 的 那样 ， 其 傅 里 叶 变 
H FU) 是 周期 为 1/AT 的 无 限 周 期 连续 函数 。 因 此 ， 我 们 需要 表征 请 (y) 的 一 个 周期 ， 而 对 一 个 周期 
取样 是 DFT 的 基础 。 

假设 我 们 想 要 在 周期 pe = 0 到 y=1/A7 ZERE F) 的 M 个 等 间距 样本 。 这 可 通过 在 如 下 频率 
处 取样 得 到 : 


A=—, m=0,1,2,--,M-1 (4.4-3) 


JE u 的 这 一 结果 代入 式 (4.4-2) ， 并 令 羽 表示 得 到 的 结果 ， 则 有 


ELi M-l 
F, = fe, m= 0,1, XM (4.4-4) 
es n=0 
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这 个 表达 式 就 是 我 们 寻找 的 离散 伟 里 叶 变 换 ? 给 定 一 个 由 / (7) 的 M 个 样本 组 成 的 集合 { 厂 } , 式 (4.4.4) 
得 出 一 个 与 输入 样本 集合 离散 傅 里 叶 变 换 相对 应 的 M 个 复 离散 值 的 样本 集合 {,} 。 反之 , AELE), 
我 们 可 以 用 傅 里 叶 反 变换 (IDFT) 复原 样本 集 { 太 } : 


i 
BERAE , n=0,1,2,---,M-1 (4.4-5) 

不 难 证 明 (见习 题 4.8) ， 把 式 (4.4-5) 的 f ARAR (4.4-4) BSH F, =F,- Xb, HEI (4.4-4) FHI F, 
代入 式 (4.4-5) 得 到 f, = f, 。 这 意味 着 式 (4.4-4) 和 式 (4.4-5) 组 成 了 一 个 离散 傅 里 叶 变 换 对 。 此 外 ， 这 
些 恒等式 指出 ， 对 于 任何 其 值 有 限 的 样本 集合 ， 正 、 反 传 里 叶 变 换 都 是 存在 的 。 注 意 ， 这 两 个 表达 式 
不 明确 地 依赖 于 取样 间隔 AT ， 也 不 依赖 于 式 (4.4-3) 中 的 频率 间隔 。 因 此 ， 离 散 传 里 叶 变 换 对 适用 于 
任何 均匀 取样 的 有 限 离散 样本 集 。 

在 前 面 的 阐述 中 , 我 们 使 用 m 和 来 表示 离散 变量 , 因为 人 们 在 推导 中 历来 都 是 这 样 做 的 。 然而 ， 
特别 是 在 二 维 情况 下 ,使 用 x 和 yy 表示 图 像 坐标 变量 并 使 用 u 和 表示 频率 变量 更 为 直观 ， 在 这 里 ， 
这 些 变量 可 理解 为 整数 。 这 样 ， 式 (4.4-4) 和 式 (4.4-5) 就 变 为 


M-1 
F(u)= > f(@eP™™ n=0,1,2,.,M -1 (4.4-6) 


x=0 


M-1l 
f(x)= ` 2 F(uje?™'™ | x =0,1,2,--,M-1 (4.4-7) 
为 简便 起 见 , 我 们 在 上 式 中 使 用 函数 表示 代替 了 下 标 2. DA, Fu) =F, A fœ) f, WAHR, 
我 们 用 式 (4.4-6) 和 式 (4.4-7) 表示 一 维 DFT 对 。 某 些 作 者 通过 在 式 (4.4-6) 中 包含 LM 项 来 代替 我 们 在 
式 (4.4-7) 中 所 示 的 方法 。 这 不 会 影响 两 个 公式 形成 一 个 傅 里 叶 变换 对 的 证 明 。 
可 以 证 明 ( 见 习题 4.9) ， 傅 里 叶 正 变换 和 反 变 换 都 是 无 限 周期 的 ， 其 周期 为 M， 即 


F(u) = F(u+kM) (4.4-8) 
和 

f(x) = f(x+kM) (4.4-9) 考虑 到 对 连续 函数 取样 的 结果 不 

是 周期 的 , 离散 函数 /to) 是 周期 函数 

式 中 ,是 整数 。 ke 的 原因 并 不 明显 。 解 释 这 一 点 的 一 
式 (4.2-20) 中 的 卷 积 的 离散 等 价 表 示 是 种 非 正 式 方法 是 ， 记 住 一 个 周期 

a DFT 中 的 取样 结果 。 反 DFT 的 结果 

h(x) = h(x (4.4-10) - Jo 对 于 DET 对 的 存在 来 说 必须 是 

f(x) K(x) = >》 f (mh(x—m) i 





m=0 
x=0,1,2,--,M-1. KÆRAR, RECEBA, SUE, I (4.410) 给 出 
了 周期 卷 积 的 一 个 周期 。 由 于 这 一 原因 ， 在 这 个 公式 中 ， 其 内 在 处 理 通常 称 为 循环 卷 积 ， 并 且 直 接 
导致 DFT 和 它 的 反 变换 的 周期 性 。 这 与 我 们 在 3.4.2 节 中 研究 的 卷 积 形成 了 对 比 ， 在 该 卷 积 中 ， 位 移 


D 注意 图 4.6(b) 中 的 区 间 [0, 1/ AT ] 覆 盖 了 该 变换 的 两 个 背靠背 的 半 周 期 。 这 意味 着 要 求 重 新 对 F, 中 的 数据 排序 ， 以 便 得 到 一 个 
周期 内 频率 从 最 低 到 最 高 的 样本 。 这 是 为 符号 表示 的 方便 性 而 必须 付出 的 代价 ， 即 在 m= 0, 1,…, M -1 处 采样 ， 而 不 使 用 原点 
两 侧 的 样本 ， 因 为 后 者 要 求 使 用 负 号 。4.6.3 节 将 讨论 对 变换 数据 排序 的 过 程 。 

D 使 用 上 表示 连续 空间 变量 及 使 用 / 表示 连续 频率 变量 时 , 我 们 一 直 非 常 小 心 。 从 现在 起 , 我 们 将 使 用 x 和 来 分 别 表示 一 维 离散 
空间 变量 和 一 维 频率 变量 。 在 处 理 一 维 函数 时 ， 我 们 将 使 用 (t, z) 和 (u, ) 来 分 别 表示 连续 空间 变量 和 频率 域 变量 。 类 似 地 ,我 们 
FHER, Alu, 台 来 表示 与 它们 对 应 的 离散 变量 。 


Fe 
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值 x 由 一个 函数 完全 滑 过 另 一 个 函数 的 要 求 来 决定 ， 且 像 在 循环 卷 积 中 那样 区 间 [0, M=1] 是 不 固定 的 。 
我 们 将 在 4.6.3 节 和 图 4.28 中 讨论 这 一 区 别 及 其 意义 。 
最 后 ,我 们 指出 ， 式 (4.2-21) 和 式 (4.2-22) 中 给 出 的 卷 积 定理 还 可 用 于 离散 变量 (见习 题 4.10) 。 
4.4.2 ”取样 和 频率 间隔 间 的 关系 一 


如 果 f(x) 由 函数 f(1) 以 AT 为 单位 间隔 取样 后 的 M 个 样本 组 成 ， 则 包含 集合 {f(x)} ,x = 
0,1, 2,…, M 一 1 的 记录 的 持续 时 间 是 


T=MAT (4.4-11) 
离散 频率 域 中 的 相应 间隔 Au 来 自 式 (4.4-3) : 
; ie th oh (4.4-12) 
AT T 
由 DFT 的 M 个 成 分 跨越 的 整个 频率 范围 是 
Q =M ^u = (4.4-13) 


这 样 , 由 式 (4.4-12) 和 式 (4.4-13) 就 可 以 看 出 , DET 的 频率 分 辩 率 Au 取决 于 连续 函数 f(D) 被 取样 的 持续 
时 间 T7， 并 且 DFT 跨越 的 频率 范围 取决 于 取样 间隔 A7 。 很 明显 ， 两 个 表达 式 给 出 了 TAIAT 的 反 转 
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图 4.11  (a) 一 个 函数 ;， (b) 该 函数 在 x 域 中 的 样本 。 在 图 (a) 中 ,1 是 一 个 连续 变量 ;在 图 (b) 中 ，x 代表 整数 值 
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4.5 两 个 变量 的 函数 的 扩展 
本 节 我 们 把 4.2 节 到 4.4 节 介绍 的 概念 扩展 到 两 个 变量 的 情形 。 


4.5.1 二 维 冲 激 及 其 取样 特性 


两 个 连续 变量 + 和 z 的 冲 激 5(t,z) 定义 为 如 式 (4.2-8) 所 示 的 形式 : 
t=27=0 


6(t,z) = ie (4.5-1a) 
0，” 鞭 他 
和 
E | j ô(t,z)dt dz =1 (4.5-1b) 
如 在 一 维 情况 那样 ， 二 维 冲 激 在 积分 下 呈现 了 取样 特性 ; 
f j i f, 2)6(t,z)dt dz = f (0,0) (4.5-2) 
或 者 ， 更 一 般 地 ， 对 位 于 坐标 (4,zo) 处 的 冲 激 ， 有 
| i fc f(t,z)5(t-t),z—z))dt dz = f (ty,Z) (4.5-3) 
如 以 前 那样 ,我们 看 到 ， 取 样 特性 在 神 激 所 在 的 位 置 产生 函数 ,/ z) 的 值 。 
对 于 离散 变量 x 和 y， 二 维 离散 冲 激 定义 为 B(x — x, Y — Yo) 
_|L, x=y=0 
d(x, y) = | 其 他 (4.5-4) 
其 取样 特性 为 


> > fv y= 0,0) (4.5-5) 


= 一 0 y=-0 





a Yo y 
式 中 , f(x, EARE x Aly ARR HT 图 4.12 二 维 单位 离散 冲 激 。 变 量 x 和 "是 离散 的 ， 且 
个 位 于 坐标 (x6,y0) 外 的 冲 激 ( 见 图 4.12) ,其 取样 6 的 值 在 除 坐标 (xo,) 外 的 任何 位 置 都 为 0 


特性 为 
YY FE y)6(e-%,9- Yo) =F Go) (4.5-6) 


x=% y=—00 
如 以 前 那样 ， 离 散 冲 激 的 取样 特性 在 该 冲 激 所 在 的 位 置 产生 离散 函数 f(x, ») BEL. 

45.2 ”二 维 连 续 傅 里 时 变换 对 

令 j 引 是 两 个 连续 变量 :和 z 的 连续 函数 。 则 其 二 维 连 续 传 里 叶 变 换 对 由 以 下 两 个 表达 式 给 出 : 


到 0 | i fa, zje 2") dt dz (4.5-7) 


f(t,z)= K | a F(u, vje du dv (4.5-8) a 
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AP, u 和 是 频率 变量 。 当 涉及 图 像 时 ,上 和 = 解释 为 连续 空间 变量 。 就 像 一 维 情况 那样 ,变量 w 和 
v 的 域 定义 了 连续 频率 域 。 


例 4.5 得 到 一 个 简单 函数 的 二 维 傅 里 叶 变 换 。 pit 
图 4.13 显示 了 一 个 模仿 例 4.1 js ea 4.1 1 








F(u,v) = 把 fe fl ne Pd de = ate ie ° Ae Pea 
其 幅度 GH) 由 下 面 的 表达 式 给 出 : va | 
is PAAT) sin(nyZ) 
Pu 中 AEN ey je (m2) 





图 413 (b) 显示 了 关于 原点 的 谱 的 一 部 分 正如 一 维 的 情况 那样 et TAN Z 的 值 成 反 
He. 这 样 >T 和 2 越 大 , eee Re” , RS Pe 


ab IF (m, »)| 


faz) AIZp, 










afl a 
GN 3 





mT.” Zp z 


图 4.13 ” (a) 一 个 二 维 函数 ; (b) 该 二 维 函 数 的 谱 的 一 部 分 (未 按 比例 画 出 ) , 
该 块 沿 : 轴 越 长 ， 则 沿 4 轴 的 谱 更 “紧凑 ”。 请 与 图 4.4 比较 


4.5.3. 二 维 取样 和 二 维 取样 定理 
类 似 于 一 维 情况 中 的 方式 ， 二 维 取样 可 用 取样 函数 (二 维 冲 激 串 ) 建 模 : 


oo 


Spray (tz) pe $ 6(t—mAT,z—nAZ) (4.5-9) 

式 中 ，AT 和 AZ 是 连续 函数 f(t,z) 沿 t 轴 和 z 轴 的 样本 
间 的 间隔 。 式 (4.5-9) 描述 了 沿 着 两 个 轴 无 限 扩展 的 周期 
冲 激 的 集合 ( 见 图 4.14) 。 如 图 4.5 中 说 明 的 一 维 情况 那样 ， 
FA Saraz (toz) FE S(t, z) 可 得 到 取样 后 的 函数 。 

如 果 由 区 间 [Amars Lmax] 和 区 间 [-v ,vv | 建立 
的 矩形 之 外 的 傅 里 时 变换 是 零 , 则 函数 f(t, z) 称 为 带 限 函 
数 ; 即 

F(u,v)=0, ulz max EL|V> Vmax (4:5-10) 

二 维 取样 定理 表明 ， 如 果 取 样 间隔 满足 


SATAZ(L, z) 





E 


az SEAT 
图 4.14 二 维 冲 激 串 





AT < (4.5-11) 


2 
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AZ < (4.5-12) 
2 
或 者 关于 取样 率 的 表达 ， 
1 

>on (4.5-13) 
All 

ee Ivo. (4.5-14) 

AZ 


则 连续 带 限 函数 ,js 习 可 以 由 其 一 组 样本 无 误 地 恢复 。 另 一 种 叙述 方法 是 : 我 们 说 , 如 果 一 个 二 维 带 限 
连续 函数 在 上 和 v 两 个 方向 上 由 以 大 于 该 函数 最 高 频率 两 倍 的 取样 率 取样 获得 的 样本 表示 ， 则 没有 信 
BER. 

图 4.15 显示 了 图 4.6(b) 和 (d) 的 二 维 等 效 图 示 。 一 个 理想 的 二 维 盒 状 滤波 器 有 图 4.13 (a) 说 明 的 形 
式 。 图 4.15 (a) 中 的 虚线 部 分 说 明了 滤波 器 的 位 置 ， 以 便 分 离 从 其 样本 重建 带 限 函数 的 必要 变换 的 单个 
周期 , 正如 4.3.3 节 那 样 。 由 4.3.4 节 我 们 知道 ， 如 果 函 数 欠 取样 ， 则 周期 将 会 重 琶 ， 并 上 且 如 图 4.15 (b) 
所 示 ， 分 离 出 单个 周期 是 不 可 能 的 。 在 这 样 的 条 件 下 ， 将 产生 混 消 。 


一 个 理想 低 通 
(BOR) 滤波 器 的 位 置 





图 415 (a) SEDEER (b) 欠 取 样 带 限 函数 的 二 维 傅 里 叶 变 换 

4.5.4 ”图 像 中 的 混淆 

本 节 把 混淆 的 概念 扩展 到 图 像 ， 并 讨论 一 些 与 图 像 取样 和 重 取 样 有 关 的 问题 。 

从 一 维 混淆 展开 i 

如 一 维 情况 下 那样 ， 如 果 只 在 两 个 坐标 方向 上 无 限 扩展 ， 二 维 连 续 变 量 1 和 z 的 连续 函数 通常 可 
以 被 带 限 。 限 制 一 个 函数 时 间 的 非常 动作 , 将 引起 在 频率 域 无 限 扩展 的 有 害 频率 成 分 , 如 4.3.4 节 所 解 
释 的 那样 。 因为 我 们 不 可 能 对 一 个 函数 无 限 地 取样 , 所 以 , 正 像 在 取样 后 的 一 维 函数 中 所 存在 的 那样 ， 
在 数字 图 像 中 混淆 总 是 存在 的 。 在 图 像 中 ， 存 在 两 种 主要 的 混淆 现象 ， 空间 混淆 和 时 间 混 淆 。 如 4.3.4 
节 讨 论 的 那样 ， 空 间 混淆 是 由 欠 取 样 造 成 的 。 时 间 混 淆 与 图 像 序列 中 图 像 间 的 时 间 间 隔 有 关 。 时 间 混 
淆 最 常见 的 例子 之 一 是 “车 轮 ” 效 应 ， 即 在 序列 图 像 ( 如 电影) 中 具有 轮 辐 的 车 轮 出 现 倒转 的 现象 。 这 
是 由 序列 中 的 帧 率 低 于 车 轮转 动 的 速度 引起 的 。 

本 章 重点 关注 空间 混淆 。 图 像 中 空间 混淆 的 主要 表现 形式 是 人 为 引信 的 缺陷 ， 如 线 状 特征 中 的 锯 
齿 、 伪 高 光 及 原 图 像 中 不 存在 的 模式 。 下 面 的 例子 说 明了 图 像 中 的 混淆 。 


249 
251 


251 


253) 列 删 除 来 实现 的 (例如 ， 要 将 图 像 缩小 一 半 ， 可 每 隔 一 行 和 一列 来 删除 一 
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例 4.6 图 像 中 的 混淆 。 

假定 我 们 有 一 个 很 完美 的 成 像 系统 ， 没 有 噪声 ， 并 能 产生 看 上 去 很 精细 的 数字 图 像 ， 但 它 能 采用 的 取 
样 数 是 固定 的 96 x 96 个 像素 。 如 果 我 们 用 该 系统 去 数字 化 棋盘 图 案 , 那 
么 它 能 解决 多 达 96 x 96 个 大 小 为 1x1 像素 的 方 格 图 案 。 在 这 种 限制 下 ， 
结果 图 像 中 的 每 个 像素 将 对 应 图 案 中 的 一 个 方 格 。 我 们 感 兴趣 的 是 考察 
当 细 节 (棋盘 方 格 的 大 小 ) 小 于 一 个 摄像 机 像素 时 会 发 生 什么 事情 ; 也 就 
是 说 ， 当 成 像 系 统 要 数字 化 大 于 96 x 96 个 方 格 的 棋盘 图 案 时 , 会 发 生 什 
么 情况 。 

图 4.16(a) 和 (b) 显示 了 对 棋盘 取样 的 结果 , 方 格 的 边 长 分 别 为 16 像素 和 6 像素 。 这 些 结果 正如 所 预料 
的 那样 。 然 而 ， 当 方 格 的 大 小 减 小 到 稍 小 于 一 个 摄像 机 像素 时 ， 就 会 产生 如 图 4.16(c) 所 示 的 严重 混淆 的 
图 像 。 最 后 ， 将 方 格 的 边 长 减 小 到 稍 小 于 0.5 个 像素 时 ， 会 产生 如 图 4.16(b) 所 示 的 图 像 。 在 这 种 情况 下 ， 
混淆 的 结果 看 上 去 还 像 是 一 个 正常 的 棋盘 图 案 。 事实 上 ， 该 图 像 是 通过 对 其 方 格 边 长 为 12 像素 的 棋盘 图 像 取 
样 得 到 的 。 最 后 一 幅 图 像 是 较 好 的 提醒 ， 即 混淆 会 产生 令 人 完全 误解 的 结果 。 


图 4.16 图 像 中 的 混淆 : 在 图 (a) 和 图 (b) 中 ， 方 格 的 边 长 分 别 是 16 个 像素 和 6 个 像素 ， 混 
消 在 视觉 上 可 以 忽略 不 计 。 在 图 ec) 和 图 (d) 中 ， 方 格 的 边 长 分 别 是 0.9174 个 像素 和 
0.4798 个 像素 ， 结 果 中 出 现 了 明显 的 混淆 。 注 意 ， 图 (d) 看 起 来 像 是 一 幅 正 常 的 图 像 


通过 稍微 散 焦 被 数字 化 的 场景 来 削弱 高 频 成 分 ， 可 以 降低 混 消 的 影响 。 如 4.3.4 节 解释 的 那样 ,在 
图 像 被 取样 之 前 ， 必 须 在 “前 端 ” 进 行 抗 混淆 滤波 ， 而 不 能 在 取样 后 ， 用 软件 抗 混淆 滤波 器 来 降低 由 
于 违反 取样 定理 所 导致 的 混 消 影响。 大 多 数 商 业 数字 图 像 处 理 程序 包 的 确 都 有 称 为 反 混 消 的 功能 。 然 
而 ， 如 例 4.7 和 例 4.8 说 明 的 那样 ， 该 术语 涉及 模糊 一 幅 数 字 图 像 以 减少 由 重 取样 引起 的 附加 混 消 ,不 
能 用 于 减少 原始 取样 过 的 图 像 的 混淆 。 有 些 商 业 数 字 摄 像 机 确实 在 镜头 上 或 传感器 本 身 的 表面 上 岁入 
了 反 混 淆 滤波 。 由 于 这 一 原因 ， 我 们 很 难 使 用 这 种 摄像 机 拍摄 的 图 像 来 说 明 混 消 。 


图 像 内 插 和 重 取样 


就 像 在 一 维 情形 中 那样 ， 由 样本 集合 完美 地 重建 一 个 带 限 图 像 函数 时 ， 要 求 在 空间 域 用 sine paz 
做 二 维 卷 积 。 如 4.3.5 节 解释 的 那样 ， 这 种 理论 上 的 完美 重建 要 求 使 用 无 限 求 和 来 内 插 ， 而 在 实践 中 则 
迫使 我 们 不 得 不 寻求 某 种 近似 。 在 图 像 处 理 中 , 二 维 内 插 最 普通 的 应 用 之 一 是 调整 图 像 的 大 小 (放大 和 
缩小 ) 。 放 大 可 视 为 过 取样 ， 缩 小 则 可 视 为 从 取样 。 这 两 种 操作 和 前 面 几 节 讨 论 的 取样 概念 之 间 的 主要 
区 别 是 ， 放 大 和 缩小 用 于 数字 图 像 。 

2.4.4 节 中 已 解释 过 内 插 。 这 里 我 们 的 兴趣 在 于 说 明 最 近邻 、 双 线性 和 双 三 次 内 插 的 性 能 。 本 节 给 
出 一 些 关 于 取样 和 反 混淆 问题 的 例子 。 当 我 们 想 要 以 整数 倍增 大 一 幅 图 像 的 尺寸 时 ， 与 过 取样 相关 的 
最 近邻 内 捅 的 一 种 特殊 情况 是 ， 采 用 像素 复制 的 放大 操作 。 例 如 ， 将 一 幅 图 像 放大 两 倍 ， 我 们 可 以 先 
复制 每 一 列 。 这 会 在 水 平方 向 上 将 图 像 尺寸 放大 一 倍 。 然 后 ， 我 们 复制 这 幅 放大 后 的 图 像 的 每 一 行 ， 
在 垂直 方向 上 将 图 像 尺寸 放 大 一 倍 。 相 同 的 步骤 可 用 于 将 图 像 放大 任意 整数 倍 。 每 个 像素 的 灰 度 级 分 
配 ， 由 新 位 置 是 老 位置 的 精确 复制 这 一 事实 来 预先 确定 。 

采用 类 似 于 放大 图 像 的 方法 ， 同 样 可 以 缩小 图 像 。 欠 取样 是 通过 行 - 






们 将 计算 机 生成 的 模型 和 向 量 图 转 
换 为 数字 图 像 时 ， 在 无 噪声 、 无 失真 
的 条 件 下 对 “完美 ”的 场景 取样 是 很 
常见 的 。 


这 个 例子 应 切合 实际 地 重建 。 =| 












不 使 用 带 限 模糊 方法 对 图 像 重 取 | 
样 的 过 程 称 为 抽取 ， | 
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行 和 一 列 ) 。 我 们 可 以 用 2.4.4 节 的 放大 网 格 模拟 来 形象 化 非 整 数 参 数 收缩 的 概念 ， 只 是 我 们 现在 扩张 


该 网 格 拟 合 原 图 像 ， 进行 灰 度 内 插 ， 然 后 青 把 网 格 缩小 为 规定 的 尺寸 。 为 减少 混淆 ， 最 好 在 缩小 图 像 之 前 


稍微 模糊 一 下 图 像 (4.8 节 将 讨论 频率 域 模糊 ) 。 一 种 替代 技术 是 对 原始 场景 超 取样 ， 然 后 采用 行 - 列 删除 法 
来 减 小 ( 重 采 样 ) 其 尺寸 。 Sa ere 吉 果 ,但 是 ,很 显然 ， 它 要 求 存 取 原 始 场 景 。 如 果 我 
们 不 能 访问 原始 场景 (实际 中 这 很 常见 ) ， 那 么 超 取 样 就 不 是 一 个 好 的 选择 。 


例 4.7 重 取 样 后 的 图 像 中 的 混淆 的 说 明 。 

一 幅 数字 图 像 缩小 后 , 混淆 效应 通常 会 变 得 更 严重 。 图 4.17 (a) 是 为 说 明 混淆 的 影响 而 故意 创建 的 一 幅 
图 像 (注意 , 外 衣 上 所 有 隔 开 的 较 细 平行 线 都 已 被 物体 磨损 ) 。 图 4.17 (a) 中 没有 不 好 的 人 为 缺陷 , 这 表明 所 
用 的 初始 取样 率 对 防止 可 见 的 混淆 是 有 效 的 。 在 图 4.17(b) 中 ， 图 像 用 行 - 列 删 除法 缩小 为 原 尺寸 的 50%。 
在 该 图 像 中 , 混淆 的 影响 十 分 明显 (作为 例子 ,可 参见 膝盖 周围 的 区 域 )。 连 续 图 像 的 反 混淆 滤波 的 数字 等 
效 操作 是 . 在 对 图 像 进行 重 取样 之 前 平滑 图 像 ， 进 而 衰减 数字 图 像 的 高 频 成 分 。 图 4.17(c) 显示 了 在 缩小 其 
尺寸 之 前 , 使 用 3 x 3 均值 滤波 器 ( 见 3.5 节 ) 平 滑 图 像 的 结果 。 它 对 图 4.17(b) 的 改进 效果 很 明显 。 为 了 方 
(ELBE, 采用 像素 复制 方法 将 图 4.17(b) 和 图 4.17(6) 放大 到 原始 尺寸 。 





abe 

图 4.17 重 取样 后 的 图 像 上 的 混淆 的 说 明 :，(a) 带 有 视觉 上 可 以 忽略 的 混淆 的 数字 图 像 ;(b) 采 
用 行 - 列 删除 法 将 图 像 尺寸 缩小 到 其 原始 尺寸 50% 后 的 结果 。 混 淆 清晰 可 见 ; (c) 在 调 

整 图 像 大 小 之 前 ， 使 用 一 个 3x3 均值 滤波 器 来 模糊 (a) 中 图 像 的 结果 。 该 图 像 比 图 b) 

更 模糊 ， 但 混淆 不 再 那样 显眼 ( 原 图 像 由 加 州 大 学 圣 巴巴 拉 分 校 信号 压缩 实验 室 提 供 ) 


当 我 们 处 理 具有 很 强 边缘 内 容 的 图 像 时 ， 混 消 的 影响 看 起 来 就 像 是 块 状 图 像 成 分 ， 这 称 为 句 齿 。 
下 面 的 例子 说 明了 这 一 现象 。 


例 4.8 图 像 缩小 中 锯齿 现象 的 说 明 。 

图 4.18 (a) 显示 了 一 幅 计算 机 生成 场景 的 1024 x 1024 数字 图 像 ， 图 像 中 混淆 可 以 忽略 。 为 了 使 混淆 
效果 (这 种 情况 下 是 锯齿 ) 更 清楚 ， 图 4.18(b) 显示 了 经 过 如 下 操作 后 的 图 像 : 将 图 (a) 缩 小 到 75% . 即 256 x 
256 大 小 、 然 后 使 用 双 线性 内 插 法 和 像素 复制 法 ， 将 该 图 像 复 原 到 原始 尺寸 。 就 像 例 4.7 中 那样 ， 在 对 图 像 重 
取样 之 前 ， 平 滑 该 图 像 可 使 混淆 的 影响 不 太 令 人 讨厌 。 图 4.18 (c) 是 在 减 小 图 像 尺 寸 之 前 使 用 5 x 5 均值 滤波 
器 的 结果 。 正 如 这 幅 图 像 显 示 的 那样 ， 锯 齿 明 显 减 少 了 。 采 用 生成 图 4.18 (c) 的 相同 方法 ， 图 4.18 (c) 同样 经 
过 了 图 像 缩小 与 复原 为 其 原始 尺寸 的 过 程 。 


例 4.9 图像 放大 中 锯齿 现象 的 说 明 。 

在 前 两 个 例子 中 ， 我 们 使 用 像素 复制 法 来 放大 较 小 的 取样 后 图 像 。 如 图 4.19 说 明 的 那样 ,通常 这 并 不 
是 一 种 首选 的 方法 。 图 4.19(a) 显示 了 一 幅 放大 为 1024x1024 像素 的 图 像 ， 它 是 从 图 4.18 (a) 所 示 图 像 中 心 
裁 出 256 x 256 像素 部 分 ， 通 过 像素 复制 的 方法 产生 的 。 注意“ 斑 驭 ”的 边缘 。 图 4.19(b) 所 示 放 大 后 的 图 
像 是 由 相同 的 256x256 像素 部 分 经 双 线性 内 插 法 产生 的 。 在 该 结果 中 ,边缘 相当 平滑 。 例 如 ， 瓶 颈 的 边缘 
和 大 棋盘 方 格 不 像 图 4.19 (b) 中 那么 斑驳， 而 与 图 4.19(a) 相 近 。 


253 


55 


146 数字 图 像 处 理 (第 三 版 ) 





abe Ee < < 人 
图 4.18 锯齿 的 说 明 : (a) 一 幅 计算 机 生成 场景 的 1024x1024 数字 图 像 ， 其 混淆 可 以 忽略 ; (b) 减 小 (a) 的 原始 
尺寸 到 25%， 再 用 双 线 性 内 插 恢复 原始 尺寸 的 结果 。 (0) 减 小 图 像 尺寸 到 25% 之 前 ， 用 5 x 5 的 均值 
滤波 模糊 图 像 ， 然 后 再 用 双 线 性 内 插 的 结果 ( 原 图 像 由 D. P. Mitchell, Mental Landscape, LLC 提供 ) 


图 4.19 图 像 放 大 : (a) 一 幅 大 小 为 1024x1024 像素 的 数字 图 像 ， 该 图 像 是 通过 对 图 4.18 (a) 中 间 裁 取 的 
256 x 256 部 分 使 用 像素 复制 法 产生 的 ;(b) 使 用 双 线 性 内 插 法 生成 的 图 像 ， 图 像 中 的 锯齿 明显 减少 


莫 尔 (波纹 ) 模式 

在 结束 本 节 之 前 , 我 们 考察 一 下 另外 一 种 人 为 缺陷 , 称 之 为 英 尔 (波纹) 模式 ,它们 有 时 是 使 用 周 
期 或 近似 周期 成 分 对 场景 取样 产生 的 。 在 光学 领域 ， 莫 尔 模式 指 的 是 在 两 个 近似 等 间隔 的 光栅 之 间 产 
生 的 差 拍 模式 。 这 些 差 拍 模式 通常 每 天 都 会 发 生 。 例 如 ， 防 虫 纱窗 重重 在 一 起 时 所 产生 的 干涉 现象 
在 数字 图 像 处 理 中 扫描 纸 质 印刷 物 如 报纸 和 杂志 时 ,或 在 具有 周期 成 分 的 图 像 中 ， 如 果 它 的 间隔 与 取 
样 的 间隔 可 比 时 ， 通 常 都 会 出 现 这 一 问题 。 与 取样 造成 的 人 为 缺陷 相 比 ， 莫 尔 模 式 更 为 常见 。 例 如 ， 
图 4.20 显示 了 葛 尔 (波纹) 效应 ,它们 是 油墨 画 ， 并 未 被 数字 化 。 分 离 情 况 下， 这 些 模 式 都 很 干净 ， 旦 
没有 干扰 。 但 在 将 一 种 模式 从 加 到 另 一 种 模式 上 时 ,会 产生 一 幅 其 频率 在 原始 模式 中 均 不 出 现 的 差 
拍 模式 。 注 意 ， 在 特殊 情况 下 ， 由 两 个 点 的 模式 所 产生 的 莫 尔 (波纹 ) 效 应， 是 下 面 的 讨论 很 感 兴趣 
的 效应 。 











a Bie a ee | iE 





图 4.20 莫 尔 的 例子 。 它 们 是 油墨 画 而 不 是 数字 化 后 的 模式 。 
将 一 个 模式 释 加 在 另 一 个 模式 上 在 数学 上 等 价 于 两 个 模式 相 乘 





D 术语 莫 尔 (moirg) 是 一 个 法 语 单词 而 非 人 各 ， 它 源 自 首先 注意 到 某 些 织物 上 出 现 干 涉 图 样 的 织 布 者 ; 该 术语 是 由 单词 mohair( 马 
海 毛 ， 一 种 使 用 安哥拉 山羊 毛 织 成 的 布 ) 演 化 而 来 的 。 
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值 很 典型 : 报纸 用 每 英寸 75 点 (简称 dpi) 的 分 辨 率 印 刷 ， 杂 志 用 133 dpi 印刷 ， 高 质量 小 册子 用 175 dpi 
印刷 。 图 4.21 显示 了 一 幅 报 纸 图 像 以 75 dpi 取样 时 产生 的 现象 。 取 样 格 (垂直 方向 和 水 平方 向 ) 和 报纸 
图 像 上 点 的 模式 ( 士 45" 方 向 ) 相互 作用 ,产生 使 得 图 像 看 起 来 像 是 布 满 斑点 的 均匀 莫 尔 模式 (4.10.2 节 
将 讨论 降低 莫 尔 于 扰 模 式 的 一 种 技术 ) 。 

作为 相关 的 兴趣 点 ， 图 4.22 显示 了 一 幅 以 400 dpi 取样 以 防止 莫 尔 (波纹 ) 效 应 的 报纸 图 像 。 目 标 
左 眼 周围 区 域 的 放大 图 像 说 明了 如 何 利用 中 间 色 点 产生 灰 度 的 深浅 。 点 的 大 小 与 图 像 灰 度 成 反比 。 在 
TKR, 点 较 小 , 或 完全 没有 点 (例如 ， 见 眼 白 部 分 ) 。 在 浅 灰 区 域 ， 点 较 大 ， 如 眼睛 下 部 所 示 。 在 
较 瞳 的 区 域 ， 当 点 的 大 小 超过 某 个 指定 值 (通常 为 50%) 时， 允许 点 沿 两 个 指定 方向 连接 起 来 形成 
一 个 互相 连接 的 网 格 ( 见 眼 睛 的 左 侧 ) 。 在 某 些 情 况 下 ， 点 仅 沿 某 个 方向 连接 ， 如 眉毛 下 面 的 右上 方 
区 域 。 





图 421 L475 dpi 取样、 类 246x 168 IRERE, 显 ERM : 
示 了 莫 尔 模式 。 这 幅 图 像 中 的 莫 尔 模式 是 在 +45° 方 (oT merece cme EtRRRNN EN 
向 的 半 色 调 点 与 南北 方向 的 取样 网 格 之 间 产 生 的 干扰 





455 ”二 维 离散 传 里 时 变换 及 其 反 变 换 
类 似 于 4.3 节 和 4.4 节 中 的 推导 过 程 ， 我 们 可 得 到 下 面 的 二 维 傅 里 时 变换 (DFT) : 


M-1N-1 
F(u, v) 人 人 PE TORMAN (4.5-15) 
x=0 y=0 
式 中 ， S(x,y) 是 大 小 为 MxN 的 数字 图 像 。 与 一 维 中 的 情况 一 样 ， xt 有 文献 中 , 我 们 有 时 会 在 DET 而 不 是 
(4.5-15) 必须 对 离散 变量 All v Æ u=0, 1,2，…, M-1 和 v= 0, 1, 2,…， | IDFT 的 前 面 看 到 常数 1MN。 这 时 , 该 党 
N-1 范围 内 求 值 "。 


数 表示 为 /1 VMN 并 包含 在 正 变换 和 反 
给 出 变换 下 (u,v) ， 我 们 可 以 使 用 传 里 时 反 变换 (IDFT) 得 到 f(x,y), | ARE. ATOE AORERE 
M-|N-1 


换 对 。 这 些 公式 都 是 正确 的 ， 但 前 提 条 件 
UR HL, 
fy) = re er 

u=0 v=0 


式 中 ，x = 0,12…,M-1,7= 0,12,…,N-1l。 式 (4.5-15) 和 式 (4.5-16) 构 成 了 二 维 离散 傅 里 叶 变换 对 。 
AES ARETE ade 它们 在 频率 域 图 像 滤 波 的 应 用 为 基础 。 | 










D 如 44.1 节 中 提 及 的 那样 ， 记 住 ， 在 本 章 中 我 们 分 别 使 用 (i,z) 和 (pv) 来 表示 二 维 连 续 空 间 变量 和 频率 域 变量 。 在 二 维 离散 情 | 
况 下 ,我 们 使 用 (x,y) 表示 空间 变量 ， 而 使 用 (u,v) 表示 频率 域 变量 。 
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46 ”二 维 离散 传 里 时 变换 的 一 些 性 质 
本 节 介绍 二 维 离散 傅 里 叶 变换 及 其 反 变 换 的 一 些 性 质 。 
4.6.1 空间 和 频率 间隔 的 关系 


空间 取样 和 相应 频率 域 间隔 的 关系 如 4.4.2 节 中 解释 的 那样 。 假 定 对 连续 函数 f(t, z) 取样 生成 了 一 幅 
数字 图 像 f(x,y) ， 它 由 分 别 在 上 和 = 方向 所 取 的 MXN 个 样 点 组 成 。 令 AT7 和 AZ 表示 样本 间 的 间隔 ( 见 
图 4.14) 。 那 么 ， 相 应 离散 频率 域 变量 间 的 间隔 分 别 由 

1 





Au = (4.6-1) 
MAT 
和 
Ay =—— (4.6-2) 
NAZ 
给 出 。 注 意 ， 频 率 域 样本 间 的 间隔 与 空间 样本 间 的 间距 及 样本 数 成 反比 。 
46.2 平移 和 旋转 
直接 代入 式 (4.5-15) 和 式 (4.5-16) 可 以 证 明 健 里 叶 变 换 对 满足 下 列 平移 特性 (见习 题 4.16) : 
f(x, yje Mni) y F(u -= Vo) (4.6-3) 
和 
fx-x0,y -1) Fu Ve Mw) (4.6-4) 


也 就 是 说 ,用 指数 项 乘 以 f(x,y) 将 使 DFT 的 原点 移 到 点 (uo,vo) ; RZ, 用 负 指 数 项 乘 以 (u,v) 将 使 
了 (x,y) 的 原点 移 到 点 (xo,yo)。 如 例 4.13 中 说 明 的 那样 ,平移 不 影响 (u,v) 的 幅度 GED 。 
使 用 极 坐 标 
x=rcosĝ, y=rsin0, u=a@cosg, v=asing 

可 得 到 下 列 变换 对 : 

f(r,0+0,) = F(@,9 +) (4.6-5) 
EHH, 若 f(x, y) WEF O 角度 , W F (u,v) 也 旋转 相同 的 角度 。 反 之 , GF (u,v) 旋转 一 个 角度 ，f (x,y) 
也 旋转 相同 的 角度 。 


4.6.3 周期 性 
如 在 一 维 情况 中 那样 ， 二 维 傅 里 叶 变 换 及 其 反 变 换 在 zx 方 向 和 Y 方 向 是 无 限 周期 的 ， 即 
F(u,v) = F(u+k,M,v) = F(u,v+k,N) = F(u+kM,v+k,N) (4.6-6) 
和 
f(x,y) = f(x+kM,y) = f(y thy) = f(x+hM, y+kN) (4.6-7) 


UH, k lk, 是 整数 。 

变换 及 其 反 变 换 的 周期 性 在 基于 DFT 算法 的 实现 上 是 重要 的 特性 。 考 虑 图 4.23 (a) 中 的 一 维 谱 。 
如 4.4.1 节 描 述 的 那样 ， 在 区 间 [0, M 一 1] 上 ， 变 换 数据 由 两 个 在 点 M2 处 相 会 且 背 靠背 的 半 个 周期 组 
成 。 针 对 显示 和 滤波 目的 ， 在 该 区 间 中 有 变换 的 一 个 完整 周期 会 更 为 方便 ， 因 为 完整 周期 中 数据 是 连 
续 的 ， 如 图 4.23 (b) 那样 。 由 式 (4.6-3) 可 得 
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f (xe?!) > F(u-uy) 
换 名 话说， 用 一 个 指数 项 乘 以 f(x) 将 位 于 原点 的 数据 (0) 移动 到 位 置 uo。 若 令 u =M/2, 则 指数 项 
变 为 er ， 因 为 x 是 整数 ， 故 它 等 于 (-1)*。 在 这 种 情况 下 ， 
f(x)(-1)* <= F(u-M 12) 


EH CD RA f(x) 将 位 于 原点 的 数据 下 (0) 移 动 到 区 间 [0, M 一 1] 的 中 心 位置 ， 像 期 望 的 那样 ， 它 对 应 
于 图 4.23 (b) 。 


F(u) 


周期 在 此 相 会 





两 个 背靠背 的 i 


0 m2-1 NM ie oer 
F(u) 


周期 在 此 相 会 


i 两 个 背靠背 的 





| 
[| = DFT 的 周期 ‘mann / 
C] = M x N 数 据 阵列 Fu, v) 
4.23” 侍 里 叶 变 换 的 中 心 : (a) 显示 了 无 限 个 周期 的 一 个 一 维 DFT; (b) EHA F(u) Zii, HOD RA 
Jo 得 到 的 移 位 后 的 DFT; (c) 显示 了 无 限 个 周期 的 一 个 二 维 DFT。 实 线 区 域 是 由 式 (4.5-15) 得 到 


的 MxN 数 据 阵列 F (u,v) 。 该 阵列 由 4 个 四 分 之 一 周期 组 成 ; 〈d) 在 计算 Fwy) ZA, FA (-1)**” 
乘 以 f(x,y) 得 到 的 移 位 后 的 DFT。 现 在 数据 包含 一 个 完整 的 位 于 中 心 的 周期 ， 这 与 图 (b) 一 样 


在 二 维 情况 下 ， 用 图 形 来 显示 这 一 情况 有 些 困难 ， 但 原理 相同 ， 如 图 4.23 (c) 所 示 。 代 替 使 用 两 个 
半 周 期 ， 现 在 有 4 个 四 分 之 一 周期 在 点 (M/2，M2) 处 相 会 ”虚线 矩形 对 应 于 二 维 DFT 的 无 限 个 周期 。 
正 像 一 维 情况 那样 ， 若 我 们 移动 数据 ， 以 便 F (0,0) 处 在 点 (M/2, N/2) 处 ， 则 可 简化 其 可 视 化 程度 。 5 
在 式 (4.6-3) PS (uo vo) = (M 12,V12) ， 可 得 到 如 下 表达 式 : 
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fœ, yI © F(u-M/2,v-N/2) (4.6-8) 


利用 该 式 移动 数据 , 以 便 如 期 望 的 那样 , E F (0,0) 处 在 由 区 间 [0, M-1] 和 [0, N-1] 定 义 的 频率 矩形 的 中 
心 处 。 图 4.23 (d) 显示 了 这 一 结果 。 我 们 将 在 本 章 稍 后 的 例 4.11 和 图 4.24 中 说 明 这 些 概 念 。 


4.6.4 ”对 称 性 


函数 分 析 得 到 的 一 个 重要 结果 是 , 任意 实 函 数 或 虚 函 数 w(x,y) 均 可 表示 为 一 个 奇数 部 分 和 一 个 偶 
数 部 分 (其 中 每 个 都 可 以 是 实 部 或 虚 部 ) 的 和 : 


w(x, y) = w(x, y) +w, (x,y) (4.6-9) 
式 中 ， 偶 数 部 分 和 奇数 部 分 定义 如 下 : 


a W(x, y) + W(-x,-Y) 


we (x, y) = 3 (4.6-10a) 


(4.6-10b) 


wd w(x, y)- wie =y) 


把 式 (4.6-10a) 和 式 (4.6-10b) FLASK (4.6-9) 给 出 恒等式 w(x,y) = wx, y) , 这样 , 就 证 明了 后 一 公式 的 正 
确 性 。 由 前 面 的 定义 有 

We (x, y) = W,(-X,-y) (4.6-1 1a) 
和 

Wo (x, y) = —W,(-x,-y) (4.6-11b) 
也 就 是 说 ， 偶 函数 是 对 称 的 ， 奇 函数 是 反对 称 的 。 因 为 DFT 和 IDEFT 中 的 所 有 指数 都 是 正 的 ， 当 我 们 
谈论 对 称 (反对 称 ) 时 , 指 的 是 关于 序列 中 点 的 对 称 (反对 称 ) 。 在 式 (4.6-11) 中 , 一 维 阵列 中 心 点 右 侧 的 
指数 考虑 为 正 ， 其 左 侧 考 虑 为 负 (在 二 维 情 况 下 类 似 ) 。 在 我 们 的 操作 中 , 仅 考 虑 非 负 指数 项 更 为 方便 ， 
在 这 种 情况 下 ， 奇 和 偶 的 定义 变 为 l 


We (x,y) = w, (M -x, N- y) (4.6-12a) 
All 
w, (x,y) =—w,(M -x,N-y) (4.6-12b) 


式 中 ，M 入 分 别 是 二 维 阵列 的 行 数 和 列 数 。 

由 初等 数学 分 析 我 们 知道 ， 两 个 偶 函 数 或 两 个 奇 函 数 的 积 是 偶 陋 | 车 要 自己 动手 证 明 一 个 奇 函 数 的 
数 ， 而 一 个 偶 函数 和 一 个 奇 画 数 的 积 是 奇数 。 另 外 ， 离 散 画 数 为 奇 | HAA, Serkan 
函数 的 唯一 方法 是 其 所 有 样本 之 和 为 零 。 这 些 特 性 导致 了 一 个 重要 结 | Rg 下 
论 ， 即 对 于 任意 一 个 离散 偶 函数 w, 和 一 个 离散 奇 函 数 w ， 有 


M-1 N-l 


EY wayway) (4.6-13) 


x=0 y=0 


换 名 话说， 由 于 式 (4.6-13) 的 自 变量 是 奇数 ， 因 此 求 和 的 结果 为 零 。 函 数 可 以 是 实 函数 或 复 函 数 。 
262 
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例 4.10 BARATAR. 

虽然 很 容易 就 可 看 出 连续 函数 的 奇偶 性 ,但 在 处 理 离 散 序 列 时 ,这些 概念 就 不 那么 直观 了 。 下 面 的 说 
明 将 帮助 我 们 弄 清 前 面 的 概念 。 考 虑 一 维 序列 

F=f). A FE EA a h 
其 中 ，M=4。 为 了 检验 偶 性 ， 必 须 满足 条 件 f(x) = 了 (4 一 x) ， 也 就 是 说 ， 我 们 要 求 
f(0)= £(4), f(2)= FQ), FM) = FB), FB) = FO) 
因为 /(4) 在 被 考察 的 范围 之 外 ， 且 它 可 以 为 任何 值 ， 所 以 了 (0) 的 值 对 于 偶 函 数 的 测试 不 重要 。 我 们 看 到 ， 
阵列 中 的 值 满足 接 下 来 的 三 个 条 件 ， 则 该 序列 是 偶 序列 。 事 实 上 ,我 们 得 出 结论 ,任何 4 点 偶 序列 必须 有 
下 列 形式 ， 
{a b c d} 
即 在 4 点 偶 序 列 中 ， 仅 需 第 二 点 和 最 后 一 点 相等 。 
奇 序 列 有 一 个 很 有 趣 的 特性 ， 即 其 第 一 项 w,(0,0) 永远 是 0， 它 遵循 直接 源 自 式 (4.6-10b) 的 一 个 事实 。 
考虑 一 维 序列 
g={g(0) 80 g(2) g(3)}={0 -1 0 H 
由 于 序列 中 的 各 项 满足 g(x) =—g(4—x) ， 因 此 我 们 很 容易 地 确认 这 是 一 个 奇 序列 。 例 如 ，g(D= -8(3) 。 
任何 4 点 奇 序列 都 有 形式 
{0 -b 0 b} 
也 就 是 说 ， 当 M 是 偶数 时 ,一 维 奇 序列 有 在 位 置 0 和 /2 处 的 点 总 是 零 的 特性 。 当 M 是 奇数 时 ,第 一 项 
仍 必 须 是 零 ， 其 余 项 形成 等 值 的 一 对 ， 但 符号 相反 。 

前 面 的 讨论 指出 ,序列 是 偶 序列 还 是 奇 序列 还 取决 于 序列 的 长 度 ,例如 ,我 们 已 经 证 明 序列 {0 -1 0 1} 
是 奇 序列 。 然而, 序列 {0 -1 0 1 0} 既 不 是 奇 序列 ， 也 不 是 偶 序 列 , 虽然 其 “基本 ”结构 表现 为 
奇 序列 。 在 解释 DET 的 结果 时 ， 这 是 一 个 重要 的 问题 。 在 本 章 稍 后 我 
们 将 说 明 偶 函 数 和 奇 函 数 的 DFT 具有 一 些 非常 重要 的 特征 。 因 此 ， 了 | 奇 序列 。 


解 一 个 函数 是 奇 函 数 还 是 偶 函 数 , 在 解释 基于 DFT 的 图 像 结 果 中 扮演 


着 重要 的 作用 。 
在 二 维 情况 中 也 有 相同 的 基本 考虑 。 例 如 ， 一 个 6 x 6 的 二 维 序列 
SE SR Re HE 
Chr OM tno =O 
IMME i Se ‘i en 
00 -2 0.2 0 
BR OO ET D 
0 ORNS G0 


是 奇 序列 。 但 在 添加 男 一 行 0 和 男 一 列 0 后 ， 导 致 的 序列 就 既 不 是 奇 序列 也 不 是 偶 序列 。 注 意 ， 该 阵列 的 
内 部 结构 是 一 个 如 3.6.4 节 讨 论 的 Sobel 模板 。 我 们 将 在 例 4.15 中 再 回顾 这 个 模板 。 
利用 前 面 的 概念 , 我 们 可 以 建立 DFT 及 其 反 变 换 的 一 些 重 要 的 对 称 性 质 。 一 个 常用 的 性 质 是 实 函 
数 f(x, y) EM eT Pray, BI 
F” (u,v) = F(-u,-v) (4.6-14) 
如 果 f(x,y) PERE PRA, SURE AE PRAY: F” (-u,—v) = 
—F(u,v). IÑ (4.6-14) 的 证 明 如 下 : 





SEMEN PRUE IS RAAT A, RIE 
反 哈 密 特有 时 用 于 指 共 信 反对 称 。 
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{fc ye Peat) 


M-i N-I 


F* (u, v) = 22 


oe f(x, yje Prip = F(-u,—v) 
x=0 y=0 

式 中 , 第 三 步 源 自 f(x,y) 是 实 函 数 这 一 事实 。 EZRA TT FT DGEBA He RAER Se 
对 称 性 。 

表 4.1 列 出 了 DFT 的 对 称 性 和 相关 的 性 质 ， 这 些 性 质 在 数字 图 像 处 理 中 很 有 用 。 回 忆 可 知 ， 双 箭 
头 表示 傅 里 叶 变 换 对 ， 即 对 于 表 中 的 任意 一 行 ， 右 边 的 性 质 可 由 拥有 左边 性 质 的 函数 的 傅 里 叶 变换 来 
满足 ， 反 之 亦 然 。 例 如 ， 第 5 条 性 质 可 读 为 : KRAS E, y) 的 傅 里 叶 变 换 是 F (u,v) ， 其 中 用 (-x, -y) 
REG y), TS, y) 的 离散 傅 里 叶 变 换 F(u, v) 是 复 函 数 ， 反 之 亦 然 。 


M-\ N-I 


= Dae Fie pengin M+! N) 


x=0 y=0 





表 4.1 二 维 DFT 及 其 反 变 换 的 某 些 对 称 性 质 。 R(u,v) 和 /(uw,v) 分 别 是 
F(u, v) 的 实 部 和 虚 部 。 术 语 复 函 数 指出 一 个 函数 有 非 零 实 部 和 虚 部 
空间 域 * 频率 域 * 
1) S(x,y) SRR SS F* (u,v) = F(-u,-v) 
2) S(x,y) 虚 函 数 ”所 F * (-u,-v) =—F (u,v) 
3) S(x,y) 实 函数 OS R(u,v) 偶 函 数 ; 1(u,v) 奇 函数 
4) f(x,y) 虚 函数 ”对 R(u,v) 奇 函 数 ; 1(u,v) 偶 函数 
5) f(-x,-y) 实 函数 e F*(u,v) 复 函 数 
6) f(-x,-y) ZS Fu) BK 
7) f*(x,y) BR OF *(-u,-v) 复 函数 
8) S (x.y) 实 范 数 和 偶 函 数 = F(u,v) 实 函 数 和 偶 函 数 
9) f(x,y) 实 函数 和 奇 函 数 <S F(u,v) 虚 函 数 和 奇 函数 
10) S(x,y) 虚 函 数 和 偶 函 数 。 F(u, v) 虚 函 数 和 偶 函 数 
11) f(x,y) 虚 函 数 和 奇 函 数 ”全 F (u,v) 实 函 数 和 奇 函 数 
12) S(x,y) 复 函 数 和 偶 函 数 <= F (u,v) 复 函 数 和 侦 函 数 
13) f(x,y) 复 函数 和 奇 函数 > Fuy) 复 函 数 和 奇 函数 


* 回 忆 可 知 ，x,y,u 和 vv 是 离散 (整数) 变量 , x 和 4 在 区 间 [0,M -1 A, yA v ERA [0,N -1 
内 。 称 一 个 复 函 数 是 偶 孙 数 意味 着 其 实 部 和 虚 部 都 是 偶 函 数 ， 称 一 个 复 函 数 为 奇 函 数 同样 意味 
着 其 实 部 和 虚 部 都 是 奇 函 数 。 


表 4.1 中 性 质 的 一 维 说 明 
些 时 候 讨 论 过 的 偶 函 数 和 奇 函数 的 概念 , 
ERA. 1 中 所 列 性 质 的 简单 例子 。 ENESA . 
MT/ 









例 4.11 









性 质 el 

3 {1 2°34) > (G0)C2 + 2 D EL a 

4 fl 2 3 4} > {C25)05-05)(- 0.5jX( — 05- -os 
ae Mea. “Te er KIX) 

9 0-1 0 1} > ANON} 

10 2 1 1 1} e {6000} 
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11 jo -1 0 1) & OCON 

12 {(4 + 4))(3 + 2j)(0 + 2) +2))} <> {(10 + 10))(4 + 2j)( -2 + 2))(4 + 2))} 

13 {0 + Of) + 1j 0+ Oj)-1-1j)} <> {0 + 0))(2-2jO + 0} -2-2))} 

例如 ,在 性 质 3 中 ,我 们 看 到 有 元 素 {1 2 3 4 的 实 函数 具有 传 里 叶 变换 ,该 变换 的 实 部 110 -2 -2 -2} 
是 偶 函 数 , 虚 部 {0 2 0 -是 奇 函 数 。 性 质 8 告 诉 我 们 , 一 个 实 偶 函 数 的 传 里 叶 变 换 也 是 一 个 实 偶 函 数 。 性 
质 12 说 明 ， 一 个 偶 复 函数 的 傅 里 叶 变换 也 是 复 偶 函数 。 其 他 性 质 的 例子 可 以 用 同样 的 方法 来 分 析 。 


例 4.12 证 明 表 4.1 中 DFT 的 一 些 对 称 性 质 。 

在 这 个 例子 中 ,我 们 证 明 表 4.1 中 的 一 些 性 质 ， 并 熟练 运用 这 些 重 要 的 性 质 ， 以 便 为 解答 本 章 未 尾 的 
一 些 习题 打下 基础 。 我 们 仅 由 左 侧 给 出 的 性 质证 明 右 侧 的 性 质 。 使 用 类 似 于 此 处 给 出 的 方式 ， 可 以 用 右 侧 
给 出 的 性 质 来 证 明 左 侧 的 性 质 。 

考虑 性 质 3， 它 读 做 : WR 了 (x,y) 是 实 函 数 ， 则 其 DFT 的 实 部 是 偶 函 数 ， 而 其 虚 部 是 奇 函 数 ; 类 似 
Hh, 如果 一 个 DFT 分 别 具 有 偶 函 数 的 实 部 和 奇 函 数 的 虚 部 ， 则 其 IDFT 是 一 个 实 函数 。 这 一 性 质 的 正式 证 明 如 
Fo F(u,v) 通常 是 复 函 数 ， 因 此 它 可 以 表示 为 一 个 实 部 和 一 个 虚 部 之 和 ， 即 FF(w,v) = R(u,v)+ jl(u,v) 。 然 
ja, A F'(u,v)=R(u,v)—jl(u.v) o ISh, # F(-u,-v) = R(—u,-v)+ j[(-u,-v)。 但 是 ， 正 如 早期 证 
明 的 那样 ， 如 果 f(x, 是 实 函 数 ， 则 基于 前 两 个 等 式 有 Ru, v) = R(-u,—v) Al (u,v) =—I(—-u,—-v) 。 根 
据 式 (4.6-11a) 和 式 (4.6-11b) 的 观点 ， 这 就 证 明了 RR 蚌 一 个 偶 函数 ,而 1 是 一 个 奇 函数 。 

下 面 ， 我 们 证 明 性 质 8。 如 果 f(x, 7 是 一 个 实 函 数 ， 那 么 由 性 质 3 可 知 F(u,v) 的 实 部 是 偶 函 数 ， 因 
此 为 证 明 性 质 8, 我 们 所 要 做 的 所 有 工作 是 证 明 : 如 果 f(x,y) ASHP, W F(u, v) 的 虚 部 是 0( 即 下 是 
实 函 数 ) 。 证 明 步 又 如 下 : 


MANA ~o 


F(u, v)= TSE pe O/MIN) 


x=0 y=0 


上 式 可 写 为 
M=1N-1 
F(u,v)= ieee 


x=0 y=0 
M-1.N-1 


= > See Pate | 


x=0 y=0 


-Ô Y [个 函数 ][ 偶 函数 - jr amy [Am - j 偶 函数 ] 


x=0 y=0 


-F Y cour wi BR -天 偶 函 数 . 偶 函数 — (B3 PRE -f PR 


x=0 y=0 


SF met. (#8 PBC] - 255 SR . 偶 函 数 ]- Db ABR] 


x=0 y=0 x=0 y=0 


= 实 函数 
第 4 步 来 自 欧 拉 公式 及 cos 和 sin 分别 是 偶 函 数 和 奇 函 数 的 事实 。 由 性 质 8 我 们 还 知道 ， 除 了 是 实 函 数 之 外 , S 
也 是 偶 函 数 。 在 倒数 第 二 行 中 ,包含 虚 部 分 量 的 仅 有 一 项 是 第 二 项 ,根据 式 (4.6-14) 可 知 它 是 0。 这 样 ， 如 果 / 是 
实 偶 函 数 ， 则 忆 是 实 函 数 。 正 如 早 些 时 候 解 释 的 那样 ， 因 为 7 是 实 函数 ， 所 以 刁 也 是 偶 函 数 。 结 论 得 证 。 
最 后 ， 我 们 证 明 性 质 6 的 正确 性 。 由 DFT 的 定义 ， 


M-IN-1 
3{ f(-x,-y)} = > ieee ee 


x=0 y=0 
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4.6.5“ 傅 里 时 谱 和 相 角 
因为 二 维 DFT 通常 是 复 函数 ， 因 此 可 使 用 极 坐 标 形式 来 表示 : 


F(u, v) =|F u,v)” (4.6-15) 
式 中 ， 幅 度 
Pu, v)|=[R (u, + F2(u, | (4.6-16) 
称 为 传 里 叶 谱 (或 频谱 ) ， 而 
D T(u,v) > 
gl) ; arctan] 26e | (4.6-17) 
称 为 相 角 。 回 忆 4.2.1 节 的 讨论 ,arctan 必 须 使 用 一 个 四 象限 反正 切 来 计算 ,如 MATLAB 的 atan2(Imag, Real) 
函数 。 ; k ; 
最 后 ， 功 率 谱 定 义 为 
Pu,v) =|F (u,v)? = R? (u,v) +P (u,v) (4.6-18) 


如 之 前 那样 ， R ALIA F (u, v) 的 实 部 和 虚 部 ， 并 且 所 有 的 计算 直接 对 离散 变量 wu = 0, 1, 2,…, MEI 
和 v=0,1,2,…,N-l1 进行 。 因 此 ，|F (u,v), gu, v) 和 Plw,v) 是 大 小 为 Mx 的 阵列 。 
实 函 数 的 传 里 叶 变 换 是 共 斩 对 称 的 【 见 式 (4.6-14) ]， 这 表明 谱 是 关于 原点 偶 对 称 的 : 
|F(u,v)| = |F (-u,-v)| (4.6-19) 
相 角 关于 原点 奇 对 称 : 


du, v) = —$(-u, =p) (4.6-20) 
它 来 自 式 (4.5-15) ” 


M-I N-I 
F0,0)= >> f(y) 
x=0 y=0 
它 指出 零 频率 项 与 了 (x,») 的 平均 值 成 正比 ， 即 


M-1N-1 ~ 
F(0,0) =MN YY f (x,y) = MNF (x,y) (4.6-21) 
MN x=0 y=0 


pag 式 中 ， 了 表示 /的 平均 值 。 从 而 有 





|F(0,0)| = MN|f (x, y)| (4.6-22) 
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因为 比例 常数 MN 通常 很 大 , 典型 地 , |F(0， rte 有 大 成 分 , 它 可 能 比 其 他 项 大 几 个 数量 级 


Ea 


因为 原点 处 的 频率 pi it £0, ALU FO, 0) 有 时 称 为 变换 的 直流 (dec) 上 成分。 这 一 术语 源 自 电 气 工 


程 ， 在 电气 工程 中 , “dc” 表 示 直 流 RE 


例 4.13 ”一 个 简单 函数 的 二 维 傅 里 时 谱 。 

图 4.24 (a) 显示 了 一 幅 简单 的 图 像 ， 图 4.24(b) 显示 了 该 图 像 的 谱 ， 其 值 已 被 标定 到 区 间 [0, 255], FF 
图 像 形 式 显 示 。 空间 域 和 频率 域 的 原点 都 在 左上 和 角 。 在 图 #24(b) 中 ， 两 件 事情 很 明显 。 如 期 望 的 那样 ， 变 
换 的 原点 的 周围 区 域 包含 了 最 高 值 (在 图 像 中 表现 为 最 亮 ) 。 但 要 注意 ,， 谱 的 4 个 角 包含 有 类 似 的 高 值 。 原 因 
是 在 前 节 中 讨论 的 周期 性 。 为 中 心 化 该 谱 ， 如 式 (4.6-8) 指出 的 那样 ， 在 计算 DFT 之 前 我 们 简单 地 用 (-17 *” 
FM (a) 中 的 图 像 。 图 4.24(c) 显示 了 结果 ， 很 明显 它 更 易于 观察 (注意 关于 中 心 点 的 对 称 性 ) 。 由 于 直流 项 支 
配 着 谱 的 值 ， 在 显示 的 图 像 中 ， 其 他 灰 度 的 动态 范围 被 压缩 了 。 为 了 给 出 那些 细节 ， 如 3.2.2 节 描 述 的 那样 ， 


我 们 执行 一 次 对 数 变换 。 图 424(d) 给 出 了 (1 + loglF(u, v)) 的 显示 ,细节 再 现 的 提升 很 明显 。 本 章 和 后 续 几 
章 中 的 多 数 谱 均 按 这 种 方式 标定 过 。 


ii EL = BE 


图 4.24 (a) AR; (b) 在 4 个 角 显 示 亮 点 的 谱 ; © 中 心 化 后 的 谱 ; (d) 经 对 数 变 换 后 ， 
增加 了 细节 的 结果 。 谱 的 零 交 叉 在 乖 直 方向 较 靠近 ， 因 为 图 (a) 中 的 矩形 在 
该 方向 上 较 长 。 全 书 所 用 的 坐标 习惯 把 空间 域 和 频率 域 的 原点 放 在 左上 角 处 





由 式 (4.6-4) 和 式 (4.6-5) 可 知 ， 谱 对 图 像 平移 是 不 敏感 的 (指数 项 的 绝对 值 是 1) , 它 随 旋 转 图 像 以 相同 
的 角度 旋转 。 图 4.25 说 明了 这 些 特性 。 图 4.25 (b) 中 的 谱 与 图 4.24(d) 中 的 谱 是 相同 的 。 很 明显 ， 图 4.24 (a) 和 
图 4.25 (a) 中 的 图 像 是 不 同 的 ， 因 此 ， 如 果 它 们 的 傅 里 叶 谱 相 同 ， 则 基于 式 (4.6-15) ， 它 们 的 相 角 一 定 不 同 。 
图 4.26 确认 了 这 一 点 。 图 4.26(a) 和 (b) 是 图 4.24(a) 和 图 4.25 (a) 的 DFT 的 相 角 阵列 (以 图 像 显示 ) o 注意 ， 相 
角 图 像 之 间 缺 少 类 似 性 ， 虽然 它们 所 对 应 的 图 像 间 的 唯一 差别 是 简单 的 平移 。 通常， 相 角 图 像 的 视觉 分 析 
很 少 能 得 到 直觉 的 信息 。 例如, 在 45° 角 方向 ,我 们 的 直觉 是 图 4.26 (a) 中 的 相 角 应 对 应 于 图 4.25 (c) TAON 


转 图 像 ， 而 不 是 图 4.24 (a) 的 图 像 。 事 实 上 ， 如 图 4.26(c) R. 旋转 后 图 像 的 相 角 有 一 个 很 强 的 方向 ， 
比 45° 小 得 多 


a lo id 


7 





图 4.25”(a) 平 移 后 的 图 4.24 (a) 中 的 矩形 ; (b) 相应 的 谱 ; (c) 旋转 后 的 矩形; 
(d) 相应 的 谱 。 对 应 于 平移 矩 mini 424(a) 中 的 原 图 像 的 谱 相同 
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DFT 的 谱 的 成 发 决定 正弦 波 的 幅度 ， 这 些 正 弱 波 结合 起 来 可 形成 结果 图 像 。 在 一 幅 图 像 的 DFT 360 
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中 , 在 任何 给 定 的 频率 处 ， 较 大 的 幅度 意味 着 图 像 中 该 频率 的 正弦 波 比较 突出 。 反之， 较 小 的 幅度 意 
味 着 图 像 中 出 现 的 正弦 波 较 少 。 如 图 4.26 所 示 ， 虽 然 相 角 成 分 的 贡献 很 不 直观 ， 但 它 恰 恰 很 重要 。 相 
角 是 各 个 正弦 成 分 关于 原点 的 位 移 的 度量 。 这 样 ， 当 二 维 DFT 的 幅度 是 一 个 阵列 时 ， 其 成 分 就 决定 了 
图 像 中 的 灰 度 ， 相 应 的 相 角 则 是 一 个 角度 阵列 ， 它 携带 较 多 关于 图 像 中 可 辨别 物体 定位 的 信息 。 下 面 
的 例子 进一步 阐明 了 这 些 概念 。 


a Bie 


图 4.26 (a) 对 应 于 图 4.24 (a) 中 中 心 化 后 的 矩形 图 像 的 相 角 阵列 ; (b) 对 应 于 图 4.25 (a) 
中 平移 后 的 图 像 的 相 角 阵列 ; (c) 对 应 于 图 4.25(c) 中 旋转 后 的 图 像 的 相 角 阵列 





例 4.14， 傅 里 叶 谱 和 相 角 的 进一步 说 明 .。 

图 4.27(b) 是 图 4.27 (a) 的 DFT 的 相 角 ,该 阵列 将 通过 视觉 分 析 引 导 我 们 将 它 与 对 应 图 像 中 的 特性 关 
联 起 来 。 然 而， 在 决定 形状 特点 时 ， 相 角 的 重要 性 在 图 4.27(c) 中 是 很 明显 的 , 它 仅 用 相 角 信息 ( 即 用 公 
式 |F(w, v)|=1 了 计算 式 (4.6-15) 的 反 傅 里 叶 变 换 来 得 到 。 尽 管 灰 度 信息 已 丢失 ( 记 住 ,该 信息 由 谱 携 带 ) ， 但 
图 像 中 关键 的 形状 特性 是 不 会 在 图 4.27 (a) PER 

图 4.27(d) 是 仅 使 用 式 (4.6-15) 的 谱 并 计算 其 IDFT 得 到 的 。 这 意味 着 若 将 指数 项 置 为 1， 这 也 同样 意味 着 
置 相 角 为 0, 结果 不 会 出 现 意外 。 它 仅 包含 灰 度 信息 ， 直 流 项 占 支配 地 位 。 图 像 中 没有 形状 信息 ,因为 相 角 已 
ENF. 

最 后 ,图 4.27(e) 和 人 再 次 证 明了 在 确定 一 幅 图 像 的 特 隆 内 容 时 相 角 所 起 的 支配 作用 。 几 4.27(e) 是 使 
用 图 4.24(a) 中 和 矩形 的 谱 和 对 应 于 妇女 图 像 的 相 角 计算 式 (4.6-15) 的 IDFT 得 到 的 。 妇 女 的 形状 显然 支配 了 
这 一 结果 。 反 之 ， 和 拢 形 支配 了 图 4.27(D ， 它 是 使 用 妇女 图 像 的 谱 和 和 矩形 的 相 角 计 算得 到 的 。 





图 4.27 (a) 妇女 图 像 ; (b) 相 角 ; (c) 仅 使 用 相 角 重建 的 妇女 图 像 ;(d) 仅 使 用 谱 
建 的 妇女 图 像 ，(e) 使 用 对 应 于 妇女 图 像 的 相 角 和 对 应 于 图 4.24 (a) AR 
形 的 谱 重 建 的 妇女 图 像 ; ( 伸 使 用 矩形 的 相 角 和 妇女 图 像 的 谱 重建 的 图 像 
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46.6 ”二 维 卷 积 定理 
将 式 (4.4-10) 扩 展 至 两 个 变量 可 得 到 下 面 的 二 维 循环 卷 积 表达 式 : 


M-1N-1 
Sx VHX Y) = > > fm, n)h(x—m, y-n) (4.6-23) 
m=0 n=0 
式 中 , x=0, 1,2,…,M 一 1,， y=0, 1,2,…,N 一 1。 如 式 (4.4-10) 那 样式 (4.6-23) 给 出 了 二 维 周期 序列 
的 一 个 周期 。 二 维 卷 积 定理 由 下 面 的 表达 式 给 出 : 
f(x, yy*h(x, y) © F(u,v)H (u,v) (4.6-24) 
反之 有 
f(x, y)A(x, y) & F(u,v)* H (u,v) (4.6-25) 
式 中 , 已 和 瓦 是 使 用 式 (4.5-15) 得 到 的 ， 且 与 之 前 一 样 ， 双 箭头 用 来 表示 表达 式 的 左边 和 右边 组 成 了 
傅 里 叶 变换 对 。 在 本 章 其 余部 分 ， 我 们 的 兴趣 是 式 (4.6-24) ， 该 式 表明 乘积 Flu, v)H(u, v) 的 IDFT 是 
fay k ha, y), 即 f 和 有 的 二 维 空间 卷 积 。 类 似 地 , 空间 卷 积 的 DFT 是 频率 域 中 相应 变换 的 乘积 。 
式 (4.6-24) 是 线性 滤波 的 基础 ， 且 如 4.7 节 中 解释 的 那样 ， 是 本 章 讨论 的 所 有 滤波 技术 的 基础 。 
因为 在 这 里 我 们 处 理 的 是 离散 量 ， 传 里 叶 变 换 的 计算 使 用 DFT 算法 
执行 。 如 果 选 择 使 用 两 个 函数 变换 的 乘积 的 IDFT 来 计算 空间 卷 积 , 则 必 
须 考虑 在 4.6.3 节 中 讨论 过 的 周期 性 问题 。 下 面 我 们 给 出 一 个 关于 该 问题 -一 一 一 一 一 - 
的 一 维 的 例子 ， 然 后 将 结论 扩展 到 两 个 变量 。 图 4.28 左边 一 列 执行 两 个 函数 /和 天 的 卷 积 ， 它 使 
用 式 (3.4-2) 的 一 维 等 式 ， 因 为 两 个 函数 具有 相同 的 尺寸 ， 该 卷 积 写 为 





我 们 将 在 4.11 节 中 讨论 计算 
DFT 的 有 效 方法 。 






399 
SOx) = fhe) 

m=0 
这 个 等 式 与 式 (4.4-10) 相同 ， 但 对 位 移 x 的 要 求 是 它 必须 足够 大 ， 以 便 使 反 转 的 完全 滑 过 f。 换 句 话 
说 ， 该 过 程 包 括 : (1) 关 于 原点 求 h 的 镜像 (即使 及 旋转 180°)[ 见 图 4.28 (c) J, (2) 以 数量 x 平移 镜像 
函数 [ 见 图 4.28(d) ]，(3) 对 每 个 平移 的 x 值 ， 计 算 前 面 公式 右边 的 全 部 乘积 之 和 。 依 据 图 4.28， 这 
意味 着 对 每 个 x 值 用 图 4.28(d) 中 的 函数 乘 以 图 4.28 (a) 的 函数 。 位 移 x 的 范围 是 要 求 h 完全 滑 过 f 的 所 
有 值 。 图 4.28 (c) 显示 了 这 两 个 函数 的 卷 积 。 注 意 ， 卷 积 是 位 移 变量 x 的 函数 ， 并 且 在 这 个 例子 中 ,要 
求 h 完 全 滑 过 f 的 x 的 范围 是 从 0 到 799。 

如 果 使 用 DFT 和 卷 积 定理 得 到 与 图 4.28 左 列 相同 的 结果 ， 就 必须 考虑 DFT 表达 式 中 国有 的 
周期 。 这 与 图 4.28 (f 和 图 4.28 (g) 中 对 两 个 周期 函数 进行 卷 积 是 等 价 的 。 卷 积 过 程 与 我 们 刚才 讨 
论 的 相同 ， 但 现在 这 两 个 函数 是 周期 函数 。 按 前 一 段 介绍 的 方法 处 理 这 两 个 函数 将 得 到 图 4.28 (j) 
所 示 的 结果 ， 很 明显 ， 它 是 不 正确 的 。 因 为 我 们 卷 积 两 个 周期 函数 ， 所 以 卷 积 本 身 也 是 周期 的 。 
在 图 4.28 中 ， 周 期 的 靠近 使 它们 互相 干扰 而 导致 所 谓 的 缠绕 错误 。 根 据 卷 积 定理 ， 如 果 计 算 两 个 
400 点 的 函数 了 和 有 的 DFT， 两 个 函数 相 乘 ， 然 后 计算 反 DFT， 那 么 将 得 到 如 图 4.28 0) 所 示 卷 积 
的 400 点 的 错误 一 段 。 

所 幸 的 是 ， 解决 缠绕 错误 问题 很 简单 。 考 虑 分 别 有 4 个 样本 和 8B 个 样本 的 两 个 函数 (x) 和 A(X), 
可 以 证 明 (Brigham[1988]) ， 如 果 把 0 添加 到 这 两 个 函数 中 ,使 它们 的 长 度 相 同 ， 并 用 PP 来 表示 ,那么 
可 以 按 如 下 方式 来 选择 ， 以 避免 缠绕 : 
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f(x) * g(x) f(x) * g(x) 
1200 s, a 
600 ond 
x x 
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r |< 
傅 里 叶 变 换 
计算 的 范围 


图 4.28 左 列 : 用 3.4.2 节 讨论 的 方法 得 到 的 两 个 离散 函数 的 卷 积 。 图 (e) 中 的 结果 是 正确 的 。 右 
列 : 相同 函数 的 卷 积 ， 但 考虑 了 DFT 的 周期 性 。 注 意图 9) 中 来自 邻近 周期 的 数据 是 如 
何 产生 缠绕 错误 而 得 不 到 正确 卷 积 结果 的 。 要 得 到 正确 的 结果 ， 必 须 对 函数 进行 填充 


在 我 们 的 例子 中 ， 每 个 函数 有 400 个 点 ,我 们 应 该 使 用 的 最 小 值 
是 P= 799， 这 意味 着 需要 在 每 个 函数 的 结尾 处 添加 399 个 0。 这 种 处 人 
理 称 为 0 填充 -作为 练习 ,读者 可 以 自己 证 明 :如 果 图 428(9 和 图 4.28(g) | 加 到 函数 的 结尾 处 更 为 简单 。 
中 的 函数 的 周期 已 通过 至 少 填充 399 个 0 的 方法 加 长 ,那么 结果 就 是 
一 个 周期 卷 积 ,其 中 每 个 周期 都 与 图 4.28 (e) 中 的 正确 结果 相等 .对 DFT 使 用 卷 积 定理 将 得 到 与 图 4.28 (e) 
相同 的 799 点 的 空间 函数 。 结 论 是 : 若 要 使 第 3 章 介绍 的 “直接 ” 卷 积 公式 法 与 DFT 方法 产生 的 卷 积 
结果 相同 ， 后 者 必须 对 函数 补足 周期 ， 再 计算 它们 的 变换 。 

形象 地 表示 二 维 情形 下 的 例子 较为 困难 ,但 我 们 可 以 得 出 关于 缠绕 错误 及 对 函数 补 0 的 相同 结论 。 
A> fw, 和 h(x, 分 别 是 大 小 为 4xB 和 CxD 像素 的 图 像 阵列 。 循环 卷 积 中 的 缠绕 错误 可 以 通过 对 这 两 
个 函数 进行 零 填充 来 避免 ， 方 法 如 下 ; 
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万 Ce) = = ay) i il É o + (4.6-27) 
和 
be ae, Eee 4 vi a (4.6-28) 
其 中 ， 
P>A+C-1 (4.6-29) 
和 
O>B+D-1 (4.6-30) 
填充 后 的 图 像 大 小 为 Px O。 如 果 两 个 阵列 大 小 相同 ， 都 为 Mx N， 则 要 求 
P>2M-1 (4.6-31) 
和 
Q>2N-1 (4.6-32) 


在 4.7.2 节 ， 我 们 将 给 出 一 个 例子 来 说 明 图 像 上 出 现 缠绕 错误 所 带 来 的 影响 。 一 般 来 说 ，DFT 算 
法 对 偶数 尺寸 的 阵列 执行 较 快 ,因此 最 好 将 尸 和 @ 选 为 满足 上 面 方程 的 最 小 偶 整数 。 如 果 两 个 阵列 大 
小 相同 ， 则 意味 着 已 和 @ 选 为 该 阵列 大 小 的 两 倍 。 

在 图 4.28(a) 和 图 本 28 (b) 中 ， 两 个 函数 的 值 在 取样 间隔 的 尾 端 可 方 
便 地 变 为 0. 如果 这 两 个 函数 中 有 一 个 函数 或 两 个 函数 的 值 在 取样 区 间 | 一个 简单 的 切 趾 函 数 是 位 于 取样 
的 尾 端 不 是 0, 那么 在 把 0 添加 到 函数 上 以 消除 缠绕 错误 时 ， 就 将 创建 | 数据 中 心 的 三 角形 ， 它 会 在 取样 数据 
一 个 不 连续 的 函数 : 这 类 似 于 用 一 个 “盒子 ”与 一 个 函数 相 乘 ， 在 频 | MALES ORR RAN 
率 域 它 意味 着 原始 变换 与 一 个 sinc 函数 的 卷 积 ( 见 例 4.1), 依次 地 ， 这 “| see, 我 们 其 至 可 以 使 用 一 个 高 斯 函 
将 造成 一 个 由 sine 函数 的 高 频 成 分 导致 的 所 谓 频 率 泄 汤 。 泄 漏 会 在 图 | 数 。 在 5.115 节 中 ,我 们 将 会 回 到 加 
像 上 产生 块 效应 。 虽 然 漏 泄 从 来 未 被 完全 消除 过 ， 但 可 以 用 另外 一 个 【= 
函数 乘 以 取样 函数 来 明显 地 加 以 减少 ， 这 个 函数 在 取样 数据 的 两 端 平滑 地 过 渡 到 接近 于 零 ， 从 而 减弱 

“盒子 ”的 (高 频 成 分 ) 急 剧 过 渡 。 当 在 图 像 重 建 ( 如 高 清晰 度 图 形 ) 中 希望 保 真 度 高 时 ， 这 种 称 为 开 窗 

或 切 下 的 方法 应 重点 考虑 。 如 果 需 要 开 窗 ， 较 好 的 方法 是 使 用 二 维 高 斯 函数 ( 见 4.8.3 节 ) 。 该 函数 的 优 
点 是 其 传 里 叶 变换 也 是 高 斯 的 ， 因 此 会 产生 较 低 的 泄漏 。 


4.6.7 ”二 维 离 散 傅 里 时 变换 性 质 的 小 结 


#42 总 结 了 本 章 中 介绍 的 主要 的 DFT 定义 。4.11.1 节 将 讨论 可 分 性 ，4.11.2 节 将 讨论 用 正 变换 
算法 得 到 反 变 换 。 第 12 章 将 讨论 相关 。 

表 4.3 总 结 了 一 些 重 要 的 DFT 对 。 虽 然 我 们 的 关注 点 是 离散 函数 ， 但 表 中 的 最 后 两 项 是 仅 针 对 连 
续 变 量 推导 的 传 里 叶 变换 对 (注意 连续 变量 符号 的 使 用 ) 。 在 此 处 包含 这 两 项 的 原因 是 ， 它 们 在 数字 图 
像 处 理 中 非常 有 用 。 微分 对 可 用 于 推导 式 (3.6-3) 中 定 类 的 拉 普 拉 斯 变换 的 频率 域 公式 ( 见 问题 4.26) 。 
高 斯 对 将 在 .4.7.4 节 讨论 。 

表 4.1 到 表 4.3 总 结 了 使 用 DET 时 的 有 用 性 质 。 许 多 这 类 性 质 是 本 章 剩余 部 分 的 关键 内 容 ， 有 些 
性 质 则 会 在 后 续 几 章 中 用 到 。 





160 数字 图 像 处 理 (第 三 版 ) 


表 4.2 DFT 定义 及 相应 表达 式 小 结 


名 t 表 A 式 
M-N- . 
1) f Gx, VRBE E (DFT) Fuvy= >) > SE e 
x=0 ys0 - 
M- N- 


2) F(u, ) 的 离散 储 里 叶 反 变换 (IDFT) | S) YY Flu, vjet Mw 
MN u=0 v=0 





3) 极 坐 标 表示 F(u,v)=|F (u,v) 
4) 谱 |F(u,v)|=[R? (u,v) + Pv]? 
R=Real(F); 1 =Imag(F) 
4 I(u,v) 
5) 相 角 - glu, v) = aretan | 
6) 功率 谱 P(u,v) =|F (u,v)? 
af 1 M-iN-1 1 
7) 均值 ION Fy LEN) 
x= y=0 


F(u,v) = F(u+kM,v) = F(u,v+k,N) = F(u+kM,v+k,N) 


8) 周期 性 人 和 大 ) 
sites f(x p)=f (xt+hM,y)= f(x y+hN)= f(x+hM,y+kN) 


M-i N- 
9) 卷 积 Jey) 太 ic) = X, 9, flm,nyh(x—m, y—n) 
m=0 n=0 
MANA 2 
10) 相关 fC ph y)= 2 2, S (mm)h(x+m, y+n) 
m=0 n=) 
11) 可 分 性 二 维 DFT 可 以 用 先 沿 图 像 的 行列 ) 计 算 一 维 DET 变换 ， 然 后 沿 结果 的 列 ( 行 ) 计 算 


一 维 变 换 。 见 4.11.1 节 
M-N- 

MNF (x,y) = J) DF (uve P Me 
u=0 v=0 


该 式 指 出 , Hi F u, 7 输入 计算 正 变换 的 算法 (上 式 右 侧 ) 中 , 将 得 到 MNS" (x,y) W 
复 共 恩 并 除 以 MXN 就 可 给 出 希望 的 反 变换 。 见 4.11.2 节 
表 4.3 DFT 对 的 小 结 。 第 12 项 和 第 13 项 中 的 闭合 表达 式 仅 对 连续 变量 有 
效 。 通 过 对 闭合 形式 的 连续 表达 式 取样 后 ， 它 们 也 可 用 于 离散 变量 
名 K DFT 对 
1) 对 称 性 见 表 4.1 
2) 线性 af (x,y) + bf; (x,y) & aF (u,v) +bF, (u,v) 


fp MN) o> F (u-u =w) 


—j2n(ux,/M+vy,/N) 


12) 使 用 正 变换 算法 得 到 傅 里 叶 反 变换 


3) 平移 性 (一 般 ) 
S(X~XsV—- Yo) > F(u,vye 


fœ yy? <> F(u-M /2,u-N/2) 
S(x-M/2,y-N/2) & F(u v)" 
f(r0+0) => F(@,9 +9) 


4) 平移 到 频率 矩形 的 中 心 (M'2, N/2) 





5) 旋转 
x=rcos@ y=rsind u=@cosg v=asing 
. f(x,y) *h(x, y) & F (u,v) (u,v) 
9) 卷 积 定理 T(x, y)h(x, y) = F(u,v)* H (u,v) 
. » ad 9 9 » 
7) 相关 定理 f (x y)*h(x, SF (u,v)H (u,v) 
S (x, y)hlx, y) > F(u,v) "CH (u,v) 
8) 离散 单位 冲 激 6(x,y) 1 
Sin(xua) sin(rub) -jncwatws) 
9) FEJE PRR rect[a,b] & ab beac, tate e 
10) 正弦 函数 sin(2nugx + 2nvyy) <=> j5[ow + Mug,v + Nuy)—6(u~Muy,v—Nvy)] 


tt 













11) 余弦 函数 


cos(2nugx + 2rvy) => [st + Muy, v + Nuy) + 6(u—Muy.v— Nvo )] 





下 面 的 傅 里 叶 变换 对 仅 连 续 变 量 可 推导 ,如 之 前 那样 , 用 上 和 = 表示 空间 变量 , 用 /上 和 上 表示 频率 变量 。 对 连续 函数 取样 后 , 这 
些 结果 可 用 于 DFT 处 理 。 
12) 微分 [右边 的 表达 式 假定 1(too,+to)=0] 









A 


( } (2) Sf (t,z) = (j2np)” (j2nv)" Fa) 
ot oz 


Sanh A Fls 
Cat A Gr) <$ (j2nr4)" F(u, yiz) = (j2nv)" F (4v) 
Ot Oz 





13) 高 斯 Alno e EPP) > ye N (4 是 常数 ) 


+ 假定 这 些 函数 已 经 过 0 填充 而 得 到 了 扩展 。 卷 积 和 相关 满足 结合 律 、 交 换 律 和 分 配 律 。 
4.7 ”频率 域 滤波 基础 
本 节 的 内 容 是 本 章 剩余 部 分 讨论 的 所 有 滤波 技术 的 基础 。 


4.7.1 频率 域 的 其 他 特性 


我 们 从 观察 式 (4.5-15) 开始 ， 式 中 F (u,v) 的 每 一 项 都 包含 有 用 指数 项 修改 过 的 f(x, y) 的 所 有 值 。 
这 样 ， 除 了 不 太 重 要 的 情况 外 ， 将 一 幅 图 像 的 某 些 特定 成 分 与 其 变换 直接 联系 起 来 通常 是 不 可 能 的 ， 
然而 ， 关 于 傅 里 叶 变 换 的 频率 成 分 和 一 幅 图 像 的 空间 特性 间 的 关系 可 以 做 出 某 些 一 般 的 叙述 。 例 如 ， 
因为 频率 直接 关系 到 空间 变化 率 ， 因 此 直观 地 将 傅 里 叶 变 换 中 的 频率 与 图 像 中 的 亮度 变化 模式 联系 起 
来 并 不 困难 。 我 们 在 4.6.5 节 已 经 说 过 ， 变 化 最 慢 的 频率 成 分 (u = v = 0) 与 图 像 的 平均 灰 度 成 正比 。 当 
我 们 远离 变换 的 原点 时 ， 低 频 对 应 于 图 像 中 变化 缓慢 的 灰 度 成 分 。 例 如 ， 在 一 幅 房 间 图 像 中 ， 这 些 可 
能 对 应 于 墙壁 和 地 板 的 平滑 灰 度 变化 。 当 我 们 从 原点 移 开 更 远 一 些 时 ， 较 高 的 频率 开始 对 应 于 图 像 中 
越 来 越 快 的 灰 度 变化 。 这 些 变 化 是 物体 的 边缘 ， 或 由 灰 度 急剧 变化 来 表征 的 其 他 图 像 成 分 。 

如 2.6.7 节 介 绍 的 那样 ， 频 率 域 中 的 滤波 技术 是 以 如 下 处 理 为 基础 的 : 修改 傅 里 叶 变换 以 达到 特 
殊 目 的 ,然后 计算 IDFT 返回 到 图 像 域 . 遵循 式 (4.6-15), 我 们 所 用 变换 的 两 个 分 量 是 变换 的 幅度 ( 谱 ) 
和 相 角 。4.6.5 节 涵 盖 了 变换 的 这 两 个 分 量 的 基本 性 质 。 在 那里 ,我 们 已 了 解 到 ， 相 角 分 量 的 视觉 分 
析 通 常 并 不 是 很 有 用 ， 然 而， 产生 该 谱 的 图 像 的 大 致 特点 提供 了 某 些 很 有 用 的 指导 。 例 如 ， 考 虑 图 
4.29 (a) ， 它 是 一 块 集成 电路 的 扫描 电子 显 微 图像 ， 放 大 了 近 2500 倍 。 除 了 器 件 本 身 的 有 趣 结构 之 外 ， 
我 们 注意 到 两 个 主要 特征 : 近似 圭 寿 "方向 的 很 强 边缘 和 两 个 由 热 感应 故障 导致 的 白色 氧化 突起 物 。 图 
4.29 (b) 中 的 傅 里 叶 谱 显 示 了 沿 王 和 "方向 的 突出 成 分 ， 这 些 成 分 对 应 于 刚刚 提 到 的 边缘 。 沿 垂直 轴 仔 
细 观 察 ， 可 看 到 一 个 稍微 左 偏 垂直 轴 的 垂直 成 分 ， 该 成 分 是 由 氧化 突起 物 的 边缘 导致 的 。 注 意 该 频率 
成 分 与 垂直 轴 的 夹 角 是 如 何 对 应 于 白色 长 物体 (关于 水 平 轴 的 ) 的 斜 度 的 ， 还 要 注意 垂直 频率 成 分 中 的 
零 是 如 何 对 应 于 氧化 突起 物 的 狭窄 垂直 范围 的 。 


a pa 


图 4.29”(a) 已 损坏 集成 电路 的 SEM FAR; (b) 图 (a) 的 傅 里 叶 谱 ( 原 图 像 由 加 拿 大 
安大略 省 哈密 尔 顿 市 McMaster 大 学 材料 研究 所 的 J M. Hudak 博士 提供 ) 





277| 


162 数字 图 像 处 理 (第 三 版 ) 


这 些 对 应 关系 通常 是 在 频率 域 与 空间 域 之 间 建 立 的 典型 联系 。 正 如 本 章 稍 后 将 要 说 明 的 那样 ， 恰 
恰 是 这 些 总 体 联系 的 类 型 与 前 面 提 到 的 频率 内 容 和 图 像 藉 度 变化 率 之 间 的 伴随 关系 ， 导 致 了 某 些 非常 
有 用 的 结果 。 下 一 节 将 说 明 修改 图 4.29 (a) 的 变换 中 的 各 种 频率 范围 的 效果 


4.7.2 ”频率 域 滤波 基础 


频率 域 滤波 是 指 先 修改 一 幅 图 像 的 传 里 叶 变 换 ， 然 后 计算 其 反 变换 ， 得 到 处 理 后 的 结果 。 由 此 ， 
若 给 定 一 幅 大 小 为 Mx N 的 数字 图 像 f(x,y)， 则 我 们 感 兴 趣 的 基本 滤波 公式 有 如 下 形式 : 


g(x,y) = I" [H(u,v)F (u, v)] (4.7-1) 


式 中 , 3" JE IDET, F (u, v) AUR f, É DFT, Heu, 区 是 滤波 函数 (简称 为 滤波 器 或 滤波 传递 函数 ) ， 
gx, )) 是 滤波 后 的 (输出 ) 图 像 。 函 数 已 HA g 是 大 小 与 输入 图 像 相 同 的 | 如 果 太 是 实 对 称 函数 而 /是 实 函数 | 
MxN 阵 列 。 如 2.6.1 节 定 义 的 那样 , 乘积 Hlu, v)F (u, VER ATE | (通常 如 此 )， 则 式 (47-) 中 的 DFT 
> yEy pg? ay ke Ad sie 48 a Ate a : 论 上 总 生成 实数 量 。 实 际 上 ， 该 反 
成 的 。 滤波 函 数 修改 输入 图 像 的 变换 来 得 到 处 理 后 的 输出 gy) 使 用 aos es | 
关于 中 心 对 称 的 函数 可 明显 简化 Hu, v) 的 技术 条 件 ， 它 要 求 Flu, vyt | 计算 错误 引起 的 寄生 复数 项 。 因 此 ，| 
被 中 心 化 。 如 4.6.3 节 解 释 的 那样 ， 这 是 通过 在 计算 变换 前 使 用 (1? | 我 们 通常 取 IDFT 的 实 部 来 形成 函数 | 
乘 以 输入 图 像 来 完成 的 。 hat 
现在 , 我 们 已 能 考虑 滤波 过 程 的 一 些 细节 。 我 们 能 构建 的 最 简单 的 滤波 器 之 一 是 滤波 器 Hu, v), CTE 
变换 的 中 心 位 置 是 0， 而 在 其 他 位 置 是 1。 当 我 们 建立 乘积 Hlu, Flu, 时 ， 该 滤波 器 将 抑制 Flu, vA 
流 项 而 “通过 ”( 即 保持 不 变 ) 所 有 其 他 项 。 由 式 (4.6-21) 可 知 ， 直 流 项 决定 图 像 的 平均 灰 度 ， 因 此 将 其 
置 0 会 把 输出 图 像 的 平均 灰 度 减 小 为 0。 图 4.30 显示 了 使 用 式 (4.7-1) 时 这 一 操作 的 结果 。 如 期 望 的 那 
样 ， 图 像 变 得 更 暗 [ 堆 平 均 表 明 存 在 负 灰 度 。 因 此 ， 尽 管 图 4.30 说 明了 原理 ， 但 不 是 原 图 像 的 真实 描 
述 ， 因 为 所 有 负 灰 度 为 显示 目的 都 被 修剪 过 ( 置 为 0) 1 

如 此 前 说 明 的 那样 ,变换 中 的 低频 与 图 像 中 缓慢 变化 
的 灰 度 成 分 和 关 ， 如 室内 的 墙壁 和 室外 少 云 的 天 空 等 。 另 
一 方面 ， 高 频 由 灰 度 的 尖锐 过 渡 造 成 ， 如 边缘 和 噪声 等 。 
因此 ， 我 们 认为 衰减 高 频 而 通过 低频 的 滤波 器 Hu, v) GE 
似 称 为 低 通 滤波 器 ) 将 模糊 一 幅 图 像 ， 具 有 相反 特性 的 滤 
波 器 ( 称 为 高 通 滤波 器 ) 将 增强 尖锐 的 细节 ,但 会 降低 图 像 
的 对 比 度 。 图 4.31 说 明了 这 些 效应 。 注 意图 4.31(e) 和 图 4.30 
之 间 的 相似 性 。 原 因 是 所 示 的 高 通 滤波 器 消去 了 直流 项 ， 
导致 了 与 图 4.30 相 同 的 基本 效果 。 对 滤波 器 加 上 一 个 小 常 
数 不 会 影响 尖锐 性 ， 但 它 的 确 能 防止 直流 项 的 消除 ， 并 保 
留 色调 ， 如 图 4.31 (所 示 。 

式 (4.7-1) 涉 及 频率 域 中 两 个 函数 的 乘积 ， 由 卷 积 定理 ， 这 意味 着 空间 域 的 卷 积 。 我 们 从 4.6.6 节 的 
讨论 知道 ， 如 果 问 题 中 的 函数 未 被 填充 ， 可 以 料 到 会 产生 混淆 误差 。 当 我 们 用 式 (4.7-1) 而 没有 填充 
时 , 考虑 一 下 会 发 生 什么 情况 。 图 4.32(a) 显示 了 一 幅 简 单 的 图 像 ， 图 4.32 (b) 是 使 用 图 4.31 (a) 所 示 
形式 的 高 斯 低 通 滤波 器 对 图 像 低 通 滤波 后 的 结果 。 如 预料 的 那样 ， 图 像 被 模糊 ， 但 模糊 不 均匀 ; 项 











图 4.30 将 傅 里 叶 变 换 中 的 FOM/2, NM2) 项 置 0， 
对 图 4.29 (a) 中 的 图 像 滤波 后 的 结果 


D 许多 二 维 DET 的 软件 实现 (如 MATLAB) 并 不 要 求 变 换 关于 中 心 对 称 。 这 意味 着 我 们 必须 安排 滤波 函数 ， 以 便 其 数据 格式 与 丰 
中 心 对 称 变换 的 数据 格式 相同 ( 即 让 原点 在 左上 角 ) 。 最 终结 果 是 生成 和 显示 滤波 器 更 为 困难 。 在 我 们 的 讨论 中 ， 为 便于 显示 ， 
我 们 使 用 中 心 对 称 的 变换 ， 这 对 于 清楚 理解 滤波 的 概念 至 关 重 要 。 只 要 保持 了 一 致 性 ， 实 践 中 可 使 用 任意 一 种 方法 
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部 的 白 边 被 模糊 ， 而 两 侧 的 白 边 未 被 模糊 。 在 应 用 式 (4.7-1) 之 前 ， 根 据 式 (4.6-31) 和 式 (4.6-32) 填充 
输入 图 像 ， 将 导致 图 4.32(c) 所 示 的 滤波 后 的 图 像 。 这 正 是 我 们 期 望 的 结果 。 


H(u,v) 


H (u,v) 







H(u, v) 


bec 
e 


a 
def 





图 4.31 上 一 行 : 频率 域 滤波 器 。 下 一 行 : 使 用 式 (4.7-1) 得 到 的 相应 的 滤波 后 的 图 像 。 在 图 (c) 
中 我 们 使 用 a= 0.85 来 得 到 图 (f) (滤波 器 本 身 的 高 度 是 1) 。 请 将 图 O -5 4.29 (a) 比较 





abe 


| permet >. | 


| 





图 4.32 (a) 一 幅 简 单 的 图 像 ; (b) 无 填充 时 使 用 高 斯 低 通 滤波 器 的 模糊 结果 ; (0) 填 
充 后 的 低 通 滤波 的 结果 。 请 比较 图 (b) 和 图 (c) 中 垂直 边缘 的 明亮 区 域 

图 4.33 给 出 了 图 4.32(b) 和 (ec) 之 间 差 异 的 原因 。 图 4.33 中 的 虚线 区 域 对 应 图 4.32 (a) 中 的 图 像 。 
如 4.6.3 节 解 释 的 那样 ， 图 4.33 (a) 显示 了 使 用 DFT 的 固有 周期 性 。 想 象 一 下 该 模糊 滤波 器 的 空间 表示 
与 该 图 像 卷 积 。 当 滤波 器 通过 虚线 图 像 区 域 的 上 方 时 ， 它 将 包围 该 图 像 的 一 部 分 及 其 右上 方 周期 图 像 
底部 的 一 部 分 。 当 一 个 暗 区 域 和 一 个 亮 区 域 在 滤波 器 下 方 时 , 结果 是 一 幅 中 等 灰 度 的 模糊 图 像 。 然 而 ， 
当 滤 波 器 通过 图 像 的 右上 侧 时 ， 滤 波 器 将 只 包围 图 像 中 的 亮 区 域 及 其 右 侧 的 相 邻 区 域 。 一 个 常数 的 平 
均 仍 是 该 常数 ， 因 此 在 这 个 区 域 滤波 将 无 效 ， 图 4.32 (b) 给 出 了 结果 。 用 0 填充 图 像 后 ， 在 周期 序列 的 
周围 建立 了 一 个 平坦 的 边界 ， 如 图 4.33 (b) 所 示 。 将 模糊 函数 与 图 4.33 (b) 所 示 填 充 过 的 “马赛 克 ” 图 像 
卷 积 ， 给 出 了 图 4.33 (c) 所 示 的 正确 结果 。 从 这 个 例子 可 以 看 到 ， 错 误 地 填充 一 幅 图 像 会 导致 错误 的 结 
果 。 如 果 滤 波 的 目的 仅 是 粗糙 的 视觉 分 析 ， 那 么 有 时 可 以 跳 过 填充 步骤 。 

到 目前 为 止 ， 讨 论 集中 在 输入 图 像 的 填充 上 ， 但 还 包含 一 个 滤波 器 ， 该 滤波 器 可 以 在 空间 域 或 频 
率 域 中 来 规定 。 然而 ， 填 充 是 在 空间 域 完 成 的 ， 这 就 提出 子 空间 填充 和 直接 在 频率 域 指定 滤波 器 间 的 
关系 这 个 重要 问题 

乍 看 之 下 ， 一 种 可 能 的 结论 是 : 处 理 频率 域 滤 波 器 填充 的 一 种 方法 是 ， 构 建 一 个 与 图 像 尺 寸 相 同 
的 滤波 器 ， 计 算 该 滤波 器 的 IDFT 得 到 相应 的 空间 滤波 器 ， 在 空间 域 填 充 这 个 空间 滤波 器 ， 然 后 计算 
其 DFT 返回 到 频率 域 。 图 4.34 所 的 一 维 例子 说 明了 这 种 方法 的 缺陷 。 图 4.34 (a) 显示 了 频率 域 中 的 一 区 2 
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个 一 维 理想 低 通 滤波 器 。 该 滤波 器 是 实 的 和 偶 对 称 的 ， 因 此 由 表 4.1 中 的 性 质 8 可 知 其 IDFT 也 是 实 
的 和 偶 对 称 的 。 图 4.34 (b) 显示 了 用 (-1)" 乘 以 频率 域 滤波 器 的 元 素 的 结果 , 并 计算 了 其 DFT 以 得 到 相 
应 的 空间 滤波 器 。 该 空间 函数 的 两 端 不 是 0， 因此， 如 图 4.34(c) 所 示 ， 对 该 函数 进行 0 填充 创建 了 两 
个 不 连续 的 函数 (在 函数 的 两 端 填充 与 在 一 端 填充 效果 相同 ， 只 要 所 用 的 0 的 总 数 相 同 即 可 ) 。 





图 4.33 使 用 DFT 时 二 维 图 像 回 有 的 周期 性 :5 (a) 未 填充 图 像 的 周期 性 ;(b) 使 用 0 填充 ( 黑 ) 后 图 像 的 周期 性 。 中 心 的 
虚线 区 域 对 应 于 图 4.32 (a) 中 的 图 像 (为 清楚 起 见 ， 两 幅 图 像 中 的 细 和 白 线 重 三 在 一 起 ， 它 们 不 是 数据 的 一 部 分 ) 
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FA 4.34 ” (a) 在 (中 心 对 称 的 ) 频 率 域 中 指定 的 原始 滤波 器 ; (b) 计算 图 (a) 的 IDFT 得 到 的 空间 表示 ; (c) 将 图 (b) 填 


en GE 意 不 连续 点 ) ; (d) 通过 计算 图 (c) 的 DFT 得 到 的 相应 的 频率 域 滤 波 器 
注意 ,图 (c) 中 的 不 连续 导致 了 振 铃 现象 为 简化 视觉 分 析 ， 点 已 连接 起 来 ， 因 此 曲线 看 起 来 是 连续 的 ) 


为 了 回 到 频率 域 , 我 们 计算 填充 后 的 空间 滤波 器 的 DFT。 图 4.34(d) 显示 了 这 一 结果 。 正 如 在 例 4.1 
中 预料 的 那样 , 空间 滤波 器 中 的 不 连续 在 其 频率 域 中 产生 了 振 铃 。 如果 [pg TETA 
bas) 以 另 一 种 方法 来 观察 ， 我 们 从 一 个 例子 知道 ， 一 个 盒 状 函数 的 传 里 叶 一 一 一 一 一 
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变换 是 一 个 其 频率 成 分 无 限 扩展 的 sinc 函数 ， 因 此 我 们 期 望 合 状 函数 的 反 变 换 也 有 相同 的 属性 。 也 就 
是 说 ， 一 个 理想 的 ( 盒 状 ) 频率 域 滤波 器 的 空间 表示 具有 无 限 扩展 的 成 分 。 因 此 ， 任 何 实现 0 填充 的 滤 
波 器 的 空间 截断 将 引入 不 连续 性 , 它 通常 会 在 频率 域 导 致 振 铃 现象 (在 这 种 情况 下 , 如 果 它 在 0 交叉 处 
做 填充 ， 可 避免 截 尾 ， 但 我 们 感 兴趣 的 是 一 般 的 过 程 ， 而 不 是 所 有 的 滤波 器 都 有 0 交叉 的 过 程 ) 。 
前 面 的 结果 告诉 我 们 , 因为 我 们 不 能 处 理 无 限 数量 的 成 分 , 所 以 不 可 能 使 用 理想 的 频率 域 滤波 器 | 见 
图 4.34 (a) ]， 并 同时 使 用 零 填充 来 避免 缠绕 错误 。 因 此 ， 需 要 有 一 个 可 以 接受 的 限制 性 决策 。 我 们 的 
目标 是 在 频率 域 使 用 一 个 特定 形状 的 滤波 器 (包括 理想 滤波 器 ) 而 不 必 涉 及 截断 问题 。 一 种 方法 是 对 图 
像 0 填充 ; 然后 在 频率 域 创建 滤波 器 ,其 尺寸 与 填充 过 的 图 像 一 样 GE, 使 用 DFT 时 ， 图 像 和 滤波 
器 的 大 小 必须 相同 ) 。 当 然 ， 这 将 导致 缠绕 误差 ， 因 为 未 对 该 滤波 器 进行 填充 。 但 在 实践 中 ， 该 错误 可 
通过 图 像 填 充 提供 的 间隔 有 效 地 减轻 , 并 尽力 消除 振 铃 现象 。 平滑 滤波 器 (如 图 4.31 中 的 那些 ) 存 在 的 问 
题 更 少 。 特 别 地 ， 为 了 直接 在 频率 域 使 用 特定 形状 的 滤波 器 进行 处 理 ， 本 章 中 我 们 采用 的 方法 是 把 
图 像 填充 为 Px CO 大 小 , 并 构造 相同 维 数 的 滤波 器 。 如 前 所 述 , 已 和 2@ 分 别 由 式 (4.6-29) 和 式 (4.6-30) 
给 出 。 
我 们 将 以 分 析 滤 波 变换 的 相 角 来 结束 这 一 节 。 因 为 DFT 是 复数 阵列 , 我 们 可 以 将 它 表示 为 实 部 和 
虚 部 : 
F (u,v) = R(u,v) + jl (u,v) (4.7-2) 
然后 ， 式 (4.7-1) 变 为 
g(xy)=3 [H(u, v)R(u,v)+ jH (u,v)I (u, v)] (4.7-3) 


HEFIR BEL BURA AEK E, Ay ERREEN (4.6-17) JERAT, BEA T Alu, v)。 
等 同 影响 实 部 和 虚 部 而 不 影响 相位 的 滤波 器 称 为 零 相 移 滤波 器 。 本 章 中 仅 考虑 这 种 类 型 的 滤波 器 。 

即使 相 角 的 很 小 变化 , 也 会 对 滤波 输出 有 很 大 的 影响 通常 是 我 们 不 希望 的 ) 。 图 4.35 说 明了 如 标量 一 
样 简单 的 变化 所 带 来 的 影响 。 图 4.35 (a) 显示 了 用 0.5 乘 以 式 (4.6-15) 中 的 角度 阵列 所 得 到 的 图 像 ， 它 不 改 
变 F(u, v), 然后 计算 IDFT。 基 本 形状 保持 不 变 , 但 灰 度 分 布 失真 很 大 。 图 4.35 (b) 显示 了 用 0.25 RA 
相 角 的 结果 。 该 图 像 几 乎 无 法 识别 。 





图 4.35 ” (a) 使 用 0.5 乘 以 式 (4.6-15) 中 的 相 角 然 后 计算 IDFT 得 到 的 图 像 ; 
(b) 使 用 0.25 乘 以 相 角 得 到 的 结果 。 两 种 情况 下 的 谱 没 有 变化 


47.3 ”频率 域 滤 波 步 又 小 结 
前 两 节 的 内 容 可 以 总 结 如 下 : 


1. 给 定 一 幅 大 小 为 MEN 的 输入 图 像 f(x, y)， 从 式 (4.6-31) 和 式 (4.6-32) 得 到 填充 参数 PP 和 Q. iÑ 
常 选择 P=2M 和 QO=2N。 
2， 对 f(x, 7) 添加 必要 数量 的 0， 形 成 大 小 为 Px O 的 填充 图 像 f(x, y)。 
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3. 用 (-1)*Y 乘 以 f(x, 力 ， 移 到 其 变换 的 中 心 

et 

5. 生成 一 个 实 的 、 对 称 的 滤波 函数 Hu, v)， 其 大 小 为 PxO， 中 心 在 (PB/2, O2) 处 "<。 用 阵列 相 乘 
形成 乘积 G(u, v) = H(u, VF (u, v); El GG, = H(i, DF (i, K 


6. 得 到 处 理 后 的 图 像 : 如 前 所 述 , 关于 中 心 对 称 有 助 于 形 
象 地 描述 滤波 过 程 并 生成 滤波 函数 
g,(%y)= | reall 3 [Glu, v)]]} ED 本 身 ， 但 它 不 是 基本 的 需求 


其 中 , 为 忽略 由 于 计算 不 准确 导致 的 寄生 复 成 分 , 选择 了 实 部 , FER p 指出 我 们 处 理 的 是 填充 
后 的 阵列 。 
7. 从 ga, VKE EARE Mx NN 区域 , 得 到 最 终 处 理 结果 g(x, y) 
图 4.36 说 明了 上 述 步 又 。 图 中 的 符号 解释 了 每 个 图 像 源 。 如 果 放 大 , 图 4.36(c) 将 会 显示 图 像 中 插 
人 的 黑 点 ， 因 为 为 了 显示 ， 负 灰 度 被 裁剪 为 0。 注 意图 4.36 (h) 中 图 像 的 暗 边 ， 它 是 使 用 零 填 充 处 理 后 
由 低 通 滤波 造成 的 。 


二 二 
ef 


TA 





图 4.36 MT 2 填充 后 的 图 像 ; 
(d) 五, 的 谱 ; (e) 大 小 为 Px O 的 关于 中 心 对 称 的 高 斯 低 通 滤波 器 ; 人 乘积 HF, Hi; y” 
与 HF, 的 IDFT 的 实 部 的 乘积 gp; (h) 裁 前 gj 的 前 MATAIRI W 列 得 到 的 最 终结 果 g 


4.7.4 ”空间 和 频率 域 滤波 间 的 对 应 

空间 域 和 频率 域 滤波 间 的 纽带 是 卷 积 定理 。 pe 
Hu, 要 与 输入 图 像 的 傅 里 时 变换 F (u, 罗 的 乘积 。 给 定 一 个 滤波 器 Hu, vy)， 假 定 我 们 想 要 找 出 其 空间 域 
的 等 价 表示 。 如 果 令 f(x,y)= 6(x,y)， 它 来 自 Oe hareak 然后 ， 由 式 (4.7-1) 可 知 滤波 后 的 输 
出 是 37 [到 (u,v)] 。 但 这 是 频率 域 滤波 器 的 反 变换 ， 它 对 应 空间 域 的 滤波 器 。 反 过 来 ， 遵 循 类 似 的 分 
析 和 卷 积 定理 ， 给 定 一 个 空间 滤波 器 ， 我 们 可 以 用 该 空间 滤波 器 的 传 里 叶 正 变换 得 到 其 频率 域 表 示 
因此 ， 两 个 滤波 器 形成 了 传 里 叶 变 换 对 ; 

h(x, y) = H (u,v) (4.7-4) 

AP, A(x, 7 是 一 个 空间 滤波 器 。 因 为 该 滤波 器 可 以 由 频率 域 滤 波 器 对 一 个 冲 激 的 响应 得 到 ,所 以 h(x, y) 





D 如 果 玉 (wv) 由 一 个 给 定 的 空间 滤波 器 Gs 生成 ， 则 可 按 如 下 方式 形成 加 (x,y) : 将 该 空间 滤波 器 的 大 小 填充 为 PpxO， 使 用 (C1)? 乘 
以 扩展 后 的 阵列 ， 并 计算 结果 的 DET 来 得 到 A (u,v). fl 4.15 给 出 了 这 个 过 各 
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有 时 称 为 Hu, v) 的 脉冲 响应 。 此 外 ， 由 于 式 (4.7-4) 的 离散 实现 中 的 所 有 数值 都 是 有 限 的 ,这样 的 滤波 器 


称 为 有 限 冲 激 响应 (FIR) 滤波 器 。 这 些 仅 是 在 本 书 中 考虑 的 一 类 线性 空间 滤波 器 。 

我 们 在 3.4.1 节 中 介绍 了 空间 卷 积 ,并 讨论 了 其 与 式 (3.4-2) 有 关 的 实现 , 它 涉及 不 同 尺寸 的 卷 积 函 
数 。 当 我 们 根据 卷 积 定理 和 DFT 谈 到 空间 卷 积 时 ， 正 如 图 4.28 解释 的 那样 ， 这 意味 着 我 们 对 周期 函 
数 执行 卷 积 操作 。 由 于 这 一 原因 ， 如 之 前 解释 的 那样 ， 式 (4.6-23) 称 为 循环 考 积 。 此 外 ,在 DFT 的 意 
义 上 ， 卷 积 包含 相同 尺寸 的 函数 ， 反 之 ， 在 式 (3.4-2) 中 ， 函 数 的 尺寸 通常 不 同 。 

在 实践 中 ,我 们 更 愿 使 用 式 (3.4-2) 和 较 小 的 滤波 器 模板 来 实现 卷 积 滤波 ， 因 为 它 在 硬件 和 /或 固 
件 实现 时 速度 更 快 ， 且 更 容易 。 然 而 ， 滤 波 的 概念 在 频率 域 更 直观 。 取 两 个 域 中 特性 的 优点 的 一 种 方 
法 是 , 在 频率 域 规定 一 个 滤波 器 , 计算 它 的 IDFT, 然后 如 构建 较 小 的 空间 滤波 模板 那样 ， 用 反 变 换 的 
结果 得 到 全 尺寸 的 空间 滤波 器 (更 正式 的 方法 将 在 4.11.4 节 中 介绍 ) 。 这 将 在 下 一 节 中 再 度 说 明 。 在 这 
一 节 稍 后 ,我 们 将 给 出 相反 的 过 程 ， 这 里 给 定 一 个 小 空间 滤波 器 ， 我 们 得 到 其 全 尺寸 频率 域 表示 。 这 
种 方法 在 频率 域 分 析 较 小 的 空间 滤波 的 特性 时 是 很 有 用 的 。 记 住 ， 在 下 面 的 讨论 中 ， 全 里 叶 变换 及 其 
反 变换 是 线性 处 理 ( 见 习题 4.14) ， 因 此 讨论 只 限于 线性 滤波 。 

在 下 面 的 讨论 中 , 我 们 使 用 高 斯 滤波 器 来 说 明 如 何 运用 频率 域 滤 波 器 指定 第 3 章 中 讨论 的 一 些小 模板 的 
系数 。 基 于 高 斯 函数 的 滤波 器 特别 重要 ， 因 为 如 表 4.3 注释 的 那样 ， 一 个 高 斯 函数 的 正 、 反 傅 里 叶 变换 都 
是 实 高 斯 函数 。 为 便于 说 明 原 理 ， 这 里 仅 讨论 一 维 高 斯 滤波 器 。 二 维 高 斯 滤波 器 在 这 一 章 稍 后 再 讨论 。 

A> H(w) 表 示 一 维 频率 域 高 斯 滤波 器 : 


H(u) =A 2” (4.7-5) 
式 中 ，o 是 高 斯 曲线 的 标准 差 。 空 间 域 中 的 相应 滤波 器 由 H(w) 的 傅 里 叶 反 变换 得 到 (见习 题 4.31) : 
h(x) = V2no Ae"? * (4.7-6) 


这 些 公 式 "很 重要 , 原因 有 二 : (1) 它们 是 一 个 传 里 叶 变换 对 ， 两 个 成 分 都 是 高 斯 函数 和 实 函 数 。 这 便于 
分 析 ， 因 为 我 们 不 必 涉 及 复数 。 另 外 ， 高 斯 曲线 很 直观 ， 并 易于 操作 。 (2) 函数 表现 为 互 易 的 。 当 Hu) 
有 一 个 较 宽 的 外 形 时 (er 值 较 大 ) ，h(x) 有 较 罕 的 外 形 ， 反 之 亦 然 。 事实 上 ， 当 o RETIER, Hu) 接 
VSR, FFA h(x) 趋 近 于 一 个 冲 激 ， 这 意味 着 在 频率 域 和 空间 域 都 不 能 滤波 。 

图 4.37(a) 和 图 4.37(b) 显示 了 频率 域 高 斯 低 通 滤 波 器 和 空间 域 对 应 低 通 滤波 器 的 曲线 。 假 定 我 们 想 要 
使 用 图 4.37(b) 中 有 h(x) 的 曲线 形状 作为 指导 来 规定 一 个 小 空间 模板 的 系数 。 这 两 个 滤波 器 之 间 的 关键 相似 性 
是 它们 的 所 有 值 都 是 下 的。 这 样 ,我 们 就 得 出 一 个 结论 : 我 们 使 用 一 个 全 部 带 正 系数 的 模板 就 可 在 空间 域 
中 实现 低 通 滤波 (如 我 们 在 3.5.1 节 中 所 做 的 那样 ) 。 作 为 参考 , 图 4.37(b) 中 显示 了 在 3.5.1 节 中 讨论 的 两 个 
模板 。 注 意 前 一 段 讨论 的 滤波 器 宽度 间 的 互 易 关系 。 频 率 域 滤波 器 越 罕 ， 其 衰减 的 低频 越 多 ,引起 的 模糊 
越 大。 在 空间 域 ， 这 意味 着 必须 使 用 较 大 的 模板 来 增加 模糊 ， 正 如 例 3.13 中 说 明 的 那样 。 

更 复杂 的 滤波 器 可 以 使 用 式 (4.7-5) 给 出 的 基本 高 斯 函数 来 构建 。 例 如 ， 我 们 可 以 用 高 斯 函数 的 差 
来 构造 一 个 高 通 滤波 器 : 


H(u) = 4e 2% — Be™ 0 (4.7-7) 
式 中 ，4>= B,al > os 。 空 间 域 中 的 相应 滤波 器 是 
h(x) = V2raide2rcix —V2no, Be?" at (4.7-8) 


图 4.37(c) 和 图 4.37(d) 显示 了 这 两 个 公式 的 曲线 。 我 们 再 次 注意 到 宽度 的 互 易 性 , 但 这 里 最 重要 的 特性 


D 像 表 43 中 提 及 的 那样 ， 高 斯 函数 的 闭合 形式 的 正 反 传 里 叶 变 换 仅 对 连续 函数 有 效 。 要 使 用 离散 公式 ， 我 们 只 需 对 连续 的 高 斯 
变换 取样 。 这 里 使 用 离散 变量 表明 我 们 正在 处 理 取样 后 的 变换 。 
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是 ，h(x) 有 一 个 正 的 中 心 项 及 在 其 两 侧 的 负 项 。 显 示 在 图 4.37(d) 中 的 小 模板 “捕捉 ”了 这 一 特点 。 这 
两 个 模板 在 第 3 章 中 用 做 锐 化 滤波 ， 即 我 们 目前 所 知道 的 高 通 滤波 器 。 


RB Hu) H(u) h(x) 


























图 4.37 (a) 频率 域 中 的 一 维 高 斯 低 通 滤波 器 ; (b) 对 应 于 图 (a) 的 空间 低 通 滤波 器 ; 《c) 频率 域 中 的 高 斯 高 通 
滤波 器 ; Cd) 对 应 于 图 (c) 的 空间 高 通 滤波 器 。 所 示 小 二 维 模板 是 我 们 在 第 3 章 中 用 过 的 空间 滤波 器 


虽然 我 们 已 经 做 了 许多 努力 ， 但 我 们 确信 ， 如 果 没 有 刚刚 建立 的 基础 ， 要 真正 理解 频率 域 滤波 是 
不 可 能 的 。 在 实践 中 , 频率 域 可 被 视 为 一 个 “实验 室 “, 我 们 在 这 里 取 频 率 内 容 和 图 像 外 观 之 间 相 应 的 
优点 。 如 本 章 后 面 多 次 展示 的 那样 ， 有 些 在 空间 域 异 常 困难 的 或 不 可 能 直接 用 公式 表达 的 任务 ， 在 频 
率 域 却 变 得 很 容易 。 一 旦 我 们 在 频率 域 通过 实验 选择 了 一 个 特定 的 滤波 器 ， 那 么 该 方法 的 实际 实现 通 
常 是 在 空间 域 完 成 的 。 一 种 方法 是 指定 试图 捕获 空间 域 中 全 部 滤波 器 函数 的 “本 质 ” 的 小 空间 模板 ， 
如 我 们 在 图 4.37 中 解释 的 那样 。 更 正式 的 方法 是 ， 以 数学 或 统计 规则 为 基础 ， 近 似 设计 一 个 二 维 数字 
滤波 器 。4.11.4 节 中 将 再 次 探讨 这 一 主题 。 


Pen AE UE 













‘ “430 we 术 步 
对 推导 出 的 滤波 器 所 期 望 那样， 
Wo 图 439(d) 显示 了 在 3 


给 出 的 步骤 中 使 用 hx yA Toate 图像 的 结果 ， $ sh 


ab 





14.38 ”(a) 一 幅 建 筑 物 的 图 像 ; (b) 该 图 像 的 谱 


abed 

















图 439 (a) SBOE RR OR eA; (b) 以 图 像 形式 显示 的 滤波 需 ; (c) 在 频率 域 中 使 用 
FE (b) 中 的 滤波 器 对 图 4.38(a) 滤波 后 的 结果 ; (qd) 使 用 (a 中 的 空间 滤波 器 对 同一 图 像 滤 波 的 结果 。 结 果 相同 


4.8 ”使 用 频率 域 滤 波 器 平滑 图 像 


本 章 的 剩余 部 分 将 介绍 频率 域 中 的 各 种 滤波 技术 ,首先 介绍 低 通 滤波 器 。 一 幅 图 像 中 的 边缘 和 其 他 
急剧 灰 度 变化 (如 噪声 ) 主要 影响 其 傅 里 叶 变 换 的 高 频 内 容 。 因 此 ， 在 频率 域 平滑 (模糊 ) 可 通过 衰减 高 频 
来 达到 ， 也 就 是 使 用 低 通 滤波 。 本 节 介 绍 三 种 类 型 的 低 通 滤波 器 ， 理想 滤波 器 、 布 特 沃 斯 滤波 器 和 高 斯 
滤波 器 。 这 三 种 滤波 器 涵盖 了 从 非常 急剧 (理想 ) 的 滤波 到 非常 平滑 (高 斯 ) 的 滤波 范围 。 布 特 沃 斯 滤波 器 有 
一 个 参数 ， 它 称 为 滤波 器 的 “ 阶 数 "。 当 阶 数 值 较 高 时 ， 布 特 沃 斯 滤波 器 接近 于 理想 滤波 器 。 对 于 较 低 的 
阶 数值 ， 布 特 沃 斯 滤波 器 更 像 高 斯 滤波 器 。 这 样 ， 布 特 沃 斯 滤波 器 就 可 视 为 两 种 “极端 ”滤波 吉 的 过 渡 。 
本 节 中 所 有 的 滤波 器 都 遵循 4.7.3 节 概 述 的 步骤 , 因此 所 有 的 滤波 函数 HU, v) 可 理解 为 大 小 为 Px O 的 离散 
函数 ， 即 离散 频率 变量 的 范围 是 u=0, 1,2,---,P-1 Mv=0,1,2,---,O-1. 


4.8.1 理想 低 通 滤波 器 


在 以 原点 为 圆心、 以 Do 为 半径 的 圆 内 ， 无 衰减 地 通过 所 有 频率 ， 而 在 该 圆 外 “ 阻 断 ”所 有 频率 的 
二 维 低 通 滤波 器 ， 称 为 理想 低 通 滤波 器 (ILPF) ; 它 由 下 面 的 函数 确定 : 


fl, Du,v) < Dy 
H(u,v) = tr Bois D, (4.8-1) 
式 中 ，Do 是 一 个 正常 数 ，D(u,v) 是 频率 域 中 点 (uv) 与 频率 矩形 中 心 的 距离 ， 即 
D(u,v) =[ uP/2) +(v-9/2] (4.8-2) 


sth, 与 以 前 一 样 ，P 和 0Q 是 用 式 (4.6-31) 和 式 (4.6-32) 填充 后 的 尺寸 。 图 4.40 (a) 显示 了 Hu, VAENE, 
图 440(b) 显示 了 以 图 像 方式 呈现 的 滤波 器 。 如 4.3.3 节 提 到 的 那样 ， 理 想 一 词 表明 在 半径 为 Du WA 
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， 所 有 频率 无 衰减 地 通过 ， 而 在 此 圆 之 外 的 所 有 频率 则 完全 被 衰减 ( 滤 除 ) 。 理 想 低 通 滤波 器 是 关于 
Raha 这 意味 着 该 滤波 器 完全 由 一 个 径 向 横 截 面 定义 ， 如 图 4.40(c) 所 示 。 将 该 横 截 面 旋转 
360" 则 得 到 二 维 滤 波 需 

对 于 一 个 理想 低 通 滤波 器 (ILPF) 模 截面 , 在 Hlwv)=1 和 Hlw,v)=0 之 间 的 过 渡 点 称 为 截止 频率 
例如 ， 在 图 4.40 所 示 的 情况 下 ， 截 止 频率 为 D,。ILPF 的 这 种 陡峭 的 截止 频率 不 能 使 用 电子 元 件 来 实 
现 , 尽管 它们 可 以 在 计算 机 上 仿真 。 对 数字 图 像 使 用 这 些 “ 非 物理 ”滤波 带 的 效果 将 在 本 节 后 面 讨论 


H(u, v) H(u, v) 
本 


— 1 





1 








D (u, v) 
t Do 
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图 4.40 (a) 一 个 理想 低 通 滤波 器 变换 函数 的 透视 图 ; (b) 以 图 像 形式 显示 的 滤波 器 ; (c) 滤波 器 径 向 横 截 面 

本 章 介绍 的 低 通 滤波 器 可 用 具有 相同 截止 频率 的 函数 研究 其 特性 而 加 以 比较 。 建 立 一 组 标准 截止 
频率 轨迹 的 一 种 方法 是 , 计算 包含 规定 的 总 图 像 功率 值 Pr 的 圆 。 该 值 是 通过 求 每 个 点 (wu, v) 处 填充 后 图 
像 的 功率 谱 成 分 之 和 得 到 的 ， 其 中 =0,1, …,P-1, v=0,1, …,Q-1, Bp 


P-1 Q- 


P, = > > Pur) (4.8-3) 


u=0 y=0 
其 中 ，P(w, VEE (4.6-18) 中 给 出 。 如 果 DET 已 被 中 心 化 ， 那 么 原点 位 于 频率 和 矩形 中 心 处 、 半 径 为 
Do 的 圆 将 包含 a% 的 功率 ， 其 中 


a= 100) EDP | (4.8-4) 


总 和 取 处 于 圆 之 内 或 边界 线 上 的 (ww v) 值 

图 4.41(a) 和 (b) 显示 了 一 幅 测 试图 像 及 其 傅 里 叶 谱 。 谱 上 重 和 至 的 圆 的 半径 分 别 为 10, 30, 60, 160 和 
460 像素 。 这 些 圆 包围 的 图 像 功率 (oo%) 分 别 为 87.0%, 93.1%, 95.7%, 97.8% 和 99.2%。 谱 迅速 衰落 ， 总 
功率 的 87% 包 含 在 半径 为 10 的 小 圆 内 


MI 


_ ee 


ayy 图 441 (a) 大 小 为 688x688 像素 的 测试 图 像 ， (b) 测 斌 图像 的 全 里 叶 谱 。 由 于 填充 ， 该 湾 的 大 小 为 图 像 大 小 的 
~ z, 但 是 ， 它 是 以 一 半 大 小 来 显示 的 ， 因 此 ， 在 页 面 上 是 匹配 的 。 在 谱 上 重 芋 的 圆 的 半径 相对 于 全 尺寸 的 谱 图 
2 像 来 说 分 别 10, 30, 60, 160 和 460。 这 些 半径 分 别 包含 了 填充 后 图 像 功率 的 87.0%, 93.1%, 95.7%, 97.8% 和 99.2% 
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例 4.16 使 用 一 个 1LPF 平滑 图 像 。 

图 4.42 显示 了 应 用 图 4:41 (b) 中 所 示 半 径 的 截止 频率 的 ILPF 的 结果 。 图 4.42 (b) 对 所 有 的 实际 目的 没有 
意义 ， 除 非 模糊 的 目的 是 消除 图 像 中 的 所 有 细 闻 ， 但 表示 最 大 物体 的 “斑点 ”除外 。 此 图 像 中 的 严重 
模糊 表明 , 图 像 中 多 数 尖锐 的 细节 信息 包含 在 被 滤波 融 滤 除 的 13%% 的 功率 内 。 随 着 滤波 器 半径 的 增 大 ， 
滤 除 的 功率 越 来 越 少 ， 导 致 的 模糊 也 越 来 越 弱 。 注 意 , 图 442(e) 到 图 4.42(e) 中 的 图 像 都 有 “ 振 铃 ” 
特征 , 随 着 被 滤 除 的 高 频 内 容 的 数量 的 减少 , 图 像 的 纹理 变 得 越 来 越 好 。 甚至 在 只 滤 除 了 总 功率 的 2% 
的 图 像 | 见 图 4.42 (e) ] 中 ， 振 铃 现象 也 很 明显 。 正 如 稍 后 我 们 将 要 看 到 的 那样 ， 这 种 振 铃 现象 是 理想 滤 
波 器 的 一 种 特性 。 最 后 ，<“= 99.2% 时 的 结果 在 噪声 区 域内 有 非常 轻微 的 模糊 ， 但 大 部 分 图 像 与 原 图 像 非 
常 接近 。 这 表明 在 这 种 特殊 情况 下 ， 图 像 中 很 少 有 边缘 信息 包含 在 0.8% 以 上 的 谱 功 率 中 。 

从 这 个 例子 中 可 以 清楚 地 看 到 , 理想 低 通 滤波 器 并 不 是 非常 实用 。 然 而, 作为 滤波 概念 发 展 的 一 部 分 ， 
研究 这 种 滤波 器 的 特性 非常 有 用 。 同 时 ， 正 如 以 下 讨论 所 示 ， 通 过 试图 解释 ILPF 在 空间 域 的 振 铃 特性 ， 
可 以 得 到 一 些 有 趣 的 见解 。 
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图 4.42 (a) 原 图 像 ，(b)~ (HH LPF 滤波 后 的 结果 ， 截 止 频 率 分 别 设置 在 半径 值 10, 30, 60, 160 #11 460 
处 ， 如 图 4.41 (b) 所 示 。 这 些 滤 波 咒 移 除 的 功率 分 别 为 总 功率 的 13%, 6.9%, 4.3%, 2.2% 和 0.8% 


ILPF 的 模糊 和 振 铃 特 性 可 用 卷 积 定 
理 来 解释 。 图 4.43 (a) 显示 了 半径 为 10 的 
ILPF 的 空间 表示 A(x, y), 图 4.43 (b) 显示 
了 一 条 通过 图 像 中 心 的 水 平 线 的 灰 度 齐 
面 线 。 由 于 ILPF 在 频率 域 的 削 面 图 类 似 
盒 状 滤波 器 ,因此 可 以 预料 相应 空间 滤 
波 器 具有 sinc 函数 形状 。 空 间 域 滤波 可 通 
过 A(x, y) 与 图 像 卷 积 来 实现 。 将 图 像 中 的 x ae 
每 个 像素 想象 为 一 个 离散 冲 激 ， 它 的 强度 图 4.43 (半径 为 5S、 大 小 为 1000x1000 AY ILPF 的 空间 域 表 
与 所 在 位 置 的 灰 度 成 正比 . 一 个 sinc 函数 AN; (b) 一 条 通过 图 像 中 心 的 水 平 线 的 灰 度 剖面 图 
与 一 个 冲 激 卷 积 就 是 在 冲 激 处 复制 这 个 sinc RÆ. sinc 函数 的 中 心 波 汶 是 引起 模糊 的 主因 ， 而 外 侧 
较 小 的 波 办 是 造成 振 铃 的 主要 原因 。 sine 函数 与 图 像 中 的 每 个 像素 卷 积 为 解释 ILPF 的 特性 提供 了 一 
个 很 好 的 模型 。 因 为 sinc 函数 的 “展开 度 ” 与 Hu, v) 的 半径 成 反比 ，Do 越 大 ， 这 个 空间 sinc 函数 就 
越 趋 近 于 一 个 与 图 像 卷 积 时 根本 不 会 导致 模糊 的 冲 激 。 我 们 现在 应 已 习惯 了 这 种 类 型 的 矛盾 特性 。 
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在 接 下 来 的 两 节 中 ， 我 们 将 说 明 很 小 或 没有 振 铃 而 达到 模糊 是 可 能 
的 ， 这 是 低 通 滤波 的 重要 目标 。 
48.2 布 特 沃 斯 低 通 滤波 器 


截止 频率 位 于 距 原 点 Du 处 的 元 阶 布 特 沃 斯 低 通 滤波 器 (BLPF) 的 
传递 函数 定义 为 










布 特 沃 斯 低 通 滤波 器 的 传递 函数 通 
常 写 为 此 处 表达 式 的 平方 根 ; 由 于 此 处 | 
我 们 关心 的 是 这 种 滤波 器 的 基本 形式 ， 
因此 为 计算 方便 去 掉 了 平方 根 。 


1 





H(u,v)= = (4.8-5) 
1+[D(u,v)/ Dy | 
式 中 ，D(w, 由 式 (4.8-2) 给 出 。 图 4.44 显示 了 该 BLPF 函数 的 透视 图 、 图 像 显示 和 径 向 剖面 图 。 
abe H(u, v) —v H(u, v) 











D(u, v) 





图 4.44 (a) 布 特 沃 斯 低 通 滤波 器 传递 函数 的 透视 图 ; (b) 显示 为 图 像 的 滤波 器 ; (c) 阶 数 为 1 到 4 的 滤波 器 的 径 向 剖面 


与 ILPF 不 同 , BLPF 传递 函数 并 没有 在 通过 频率 和 滤 除 频率 之 间 给 出 明显 截止 的 急剧 不 连续 性 。 对 于 
具有 平滑 传递 函数 的 滤波 右 ， 可 在 这 样 一 点 上 定义 截止 频率 ， 即 使 得 Hu, v) 下 降 为 其 最 大 值 的 某 个 百分比 
的 点 。 在 式 (4.8-5) 中 ,截止 频率 点 是 当 Diu, v) = Do 时 的 点 [ 即 Au, Vv) 从 其 最 大 值 1 下 降 为 50% |. 


例 4.17 ”使 用 布 特 沃 斯 低 通 滤波 器 平滑 图 像 。 二 

图 4.45 显示 了 将 式 (4.8-5) 中 的 BLPF 应 用 于 图 4.45 (a) 的 结果 ， 其 中 = 2， 记 等 于 图 4.41 (b) 所 示 的 
5 个 半径 。 不 像 图 4.42 所 示 的 ILPF 的 结果 ， 我 们 注意 到 ， 此 处 模糊 的 平滑 过 渡 是 截止 频率 增 大 的 函数 。 
此 外 ,使 用 这 种 特殊 BLPF 处理 过 的 任何 图 像 中 都 没有 可 见 的 振 铃 现象 ， 这 要 归 因 于 这 种 滤波 器 在 低频 和 
高 频 之 间 的 平滑 过 渡 。 






a 
I 


eee a 











me ee = 
UI = T s I 


veseaaaa| plea AEE A a re 


图 445 (a) BEHS; (b) (0 使 用 2 BY BLPF 的 结果 ，BLPF 
的 截止 频率 位 于 图 4.41 所 示 的 半径 处 。 与 图 4.42 比较 
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空间 域 的 一 阶 布 特 沃 斯 滤波 器 没有 振 铃 现象 。 在 二 阶 滤波 器 中 ， 振 铃 现 象 通常 很 难 察觉 ,但 更 高 
阶 数 的 滤波 器 中 振 铃 现 象 会 很 明显 。 图 4.46 比较 了 不 同 阶 数 的 BLPF 的 空间 表示 (所 有 情况 下 均 使 用 截 
止 频率 5) ,还 显示 了 通过 每 个 滤波 器 中 心 的 水 平 扫 描 线 的 灰 度 剖面 图 。 这 些 滤 波 器 是 使 用 生成 图 4.43 的 
相同 过 程 来 获得 并 显示 的 。 为 便于 比较 ， 使 用 伽 马 变换 [ 见 式 (3.2-3) ] 对 图 4.46 中 的 图 像 进行 了 额外 
增强 。 一 阶 BLPF | 见 图 4.46 (a) ] 没有 振 铃 和 负 值 。 二 阶 BLPF 的 确 显示 了 轻微 的 振 铃 和 较 小 的 负 值 ， 
但 远 没 有 在 ILPF 中 那样 明显 。 正如 其 余 图 像 所 示 , 在 BLPF 中 , 高 阶 滤波 器 中 的 振 铃 现象 变 得 很 明显 。 
20 阶 布 特 沃 斯 滤波 器 呈现 出 了 与 工 PF 类 似 的 特性 (极限 情况 下 ,两 个 滤波 器 相同 ) 。 因此 ， 二 阶 BLPF 
是 在 有 效 的 低 通 滤波 和 可 接受 的 振 铃 特性 之 间 的 较 好 折 中 。 
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图 4.46 (a)~(d) PATH 1, 2,5 和 20 的 BLPF 的 空间 表示 及 相应 的 通过 滤波 器 中 心 的 灰 度 剖面 图 (所 有 
情况 下 大 小 均 为 1000x1000， 日 截止 频率 为 5) 。 观 察 作 为 滤波 器 阶 数 的 函数 的 振 铃 是 如 何 增加 的 


4.8.3 ”高 斯 低 通 滤波 器 
一 维 高 斯 低 通 滤波 器 (GLPF) 在 4.7.4 节 中 已 介绍 过 ， 当 时 介绍 它 的 目的 是 用 来 帮助 寻找 空间 域 与 
频率 域 之 间 的 重要 联系 。 这 些 滤波 需 的 二 维 形 式 由 下 式 给 出 : 
H(u,v) =e? 2" (4.8-6) 
其 中 ， 如 式 (4.8-2) 中 那样 ，D(u, v) 是 距 频 率 和 矩形 中 心 的 距离 。 为 与 本 节 讨 论 的 滤波 器 保持 一 致 ， 这 里 
我 们 并 未 像 在 4.7.4 节 那样 使 用 一 个 最 高 值 为 1 的 常量 乘 数 。 与 以 前 一 样 ，c 是 关于 中 心 的 扩展 度 的 度 
量 。 通 过 令 o= Du， 我 们 可 以 在 本 节 中 使 用 其 他 滤波 器 的 表示 法 来 表示 该 滤波 器 : 
H(u,v) = e72 (usv)/2D5 (4.8-7) 
式 中 ，Do 是 截止 频率 。 当 Du, v)= Do 时 ，GLPF 下 降 到 其 最 大 值 的 0.607 处 。 
如 表 4.3 所 示 ,GLPF 的 傅 里 叶 反 变换 也 是 高 斯 的 .这 意味 着 通过 计算 式 (4.8-6) 或 式 (4.8-7) 的 IDFT 
得 到 的 空间 高 斯 滤波 器 将 没有 振 铃 。 图 4.47 显 示 了 一 个 GLPF 函数 的 透视 图 、 图 像 显示 和 径 向 剖面 图 ， 
K 4.4 总 结 了 本 节 讨 论 的 低 通 滤波 器 


abc H (u, v) ey H (u, v) 








s Do = 10 
Via 
Do=20 
"Dy = 40 
7 Do = 100 


x 





ua 
— (u, v) 


图 4.47 (a) 一 个 GLPF 传递 函数 的 透视 图 ; (b) 显示 为 图 像 的 滤波 器 ; 〈c) 不 同 Pu 值 的 滤波 器 径 向 剖面 图 
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表 4.4” 低 通 滤波 器 。Do 是 截止 频率 ，n 是 布 特 沃 斯 滤波 器 的 阶 数 


布 特 沃 斯 


H(u,v) = 















1, D(u,v)< Dy 


— ,—D*(uv)/2D; 
0, D(u,v) > Dy H(u,v)=e 


Has] 





1 
1+[D(u,v)/ Do} 


例 4.18 “使 用 高 斯 低 通 滤波 器 平滑 图 像 。 a 2 
图 4.48 aig GLPF | 后 的 结果 ， 其 中 等 了 4.41(b) 中 的 5 
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图 448 (a) 原 图 像 ，(b)~ 全 使 用 截止 频率 位 于 图 4.41 所 示 半 径 处 的 GLPF 对 图 像 滤 波 后 的 结果 。 请 比较 图 4.42 和 图 4.45 
4.8.4 低 通 滤波 的 其 他 例子 


在 下 面 的 讨论 中 , 我 们 将 说 明 频 率 域 中 低 通 滤波 的 几 个 实际 应 用 。 第 一 个 例子 来 自 机 器 感知 领域 
即 字符 识别 的 应 用 ; 第 二 个 例子 来 自 印 刷 和 出 版 业 ; 第 三 个 例子 关系 到 卫星 图 像 和 航空 图 像 的 处 理 。 
类 似 的 结果 可 用 3.5 节 讨论 的 低 通 空间 滤波 技术 得 到 。 

图 4.49 显示 了 一 幅 低 分 辩 率 文本 图 像 的 例子 。 例 如 ， 我 们 会 在 传真 、 复 印 材料 和 历史 记录 中 遇 到 
这 样 的 文本 。 这 个 特殊 的 例子 中 并 不 存在 其 他 如 污点 、 折 痕 和 破 痕 这 样 的 问题 。 图 4.49 (a) 中 的 放大 部 
分 表明 该 文件 中 的 字符 因 分 辩 率 不 足 产生 了 形状 失真 ， 且 许多 字符 已 断 开 。 尽 管 人 为 填充 这 些 空隙 在 
视觉 上 并 不 困难 ， 但 机 器 识别 系统 在 阅读 这 些 断 开 字 符 时 却 存在 困难 。 处 理 这 种 问题 的 一 种 方法 是 ， 
通过 模糊 输入 图 像 来 连接 输入 图 像 中 的 这 些小 空 颖 。 图 4.49(b) 显示 使 用 Do = 80 的 高 斯 低 通 滤波 器 简 
单 处 理 图 像 后 ， 很 好 地 修复 了 字符 。 这 些 图 像 的 大 小 为 44 x 508 像素 。 

低 通 滤波 是 印刷 和 出 版 业 常 用 的 一 种 技术 ， 在 这 里 用 来 做 预 处 理 ， 包 括 3.63 节 中 讨论 过 的 去 锐 
化 模板 。“ 美 容 ” 处 理 是 低 通 滤波 在 印刷 业 中 的 另 一 个 应 用 。 图 450 显 

示 了 低 通 滤波 的 一 个 应 用 ， 与 清晰 的 原 图 像 相 比 ， 低 通 滤波 后 的 图 像 leone AA | 

看 上 去 更 平滑 、 更 柔和 。 对 于 人 脸 ， 主 要 目的 是 减少 皮肤 细 纹 的 锐 化 
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程度 和 小 斑点 。 从 图 4.50 (b) 和 图 4.50(c) 中 的 放大 部 分 可 明显 看 出 , 眼睛 周围 的 细 纹 已 明显 减少 , 事实 
平滑 后 的 图 像 看 上 去 更 为 柔和 、 更 美观 . 


Historically, certain computer Historically, certain computer ab 
programs were written using programs were written using 

only two digits rather than oniy two digits rather than 

four to define the applicable four to define the applicable 

year. Accordingly, the year. Accordingly, the 

company's software may company's software may 

recognize a date using "00" recognize a date using "00" 

as 1900 rather than the year as 1900 rather than the year 

2000. 2000. 


E ea 
图 4.49 (a) 低 分 辩 率 文本 例子 (注意 放大 图 中 的 断 开 字符 ) ; (b) 使 用 
GLPF 对 图 像 滤波 后 的 结果 ( 断 开 的 字符 段 已 被 连 在 一 起 ) 





图 4.50 (a) 原 图 像 (784x732 像素 ) ; (b) 使 用 Do= 100 的 GLPF 对 图 像 滤波 后 的 结果 ; OA D= 
80 的 GLPF 对 图 像 滤 波 后 的 结果 。 注 意图 (b) 和 图 (c) 中 放大 部 分 的 皮肤 皱纹 已 减少 了 


图 4.51 显示 了 相同 图 像 的 两 种 低 通 滤波 应 用 , 但 是 具有 不 同 目 的 。 图 4.51 (a) 是 一 幅 显 示 了 部 分 黑 
西 哥 湾 (暗色 ) 和 佛罗里达 (亮色 ) 的 、 大 小 为 808x754 的 其 高 分 辨 KIRAT (VHRR) 图 像 ， 该 图 像 由 
NOAA 卫星 拍摄 (注意 水 平 传感器 扫描 线 ) 。 水 体 间 的 边界 是 由 环流 引起 的 。 这 幅 图 像 是 直观 的 遥感 
图 像 ， Pee, 沿 场景 扫描 方向 产生 突出 扫描 线 的 倾 问 ( 见 例 4.24 中 关于 物理 原因 的 说 明 ) 。 低 通 
滤波 是 降低 这 些 扫描 线 的 影响 的 简略 方法 , 如 图 4.51 (b) 所 示 (4.10 节 和 5.4.1 节 中 将 考虑 更 为 有 效 的 
方法 ) 。 该 图 像 是 使 用 Do = 50 的 高 斯 低 通 滤波 器 得 到 的 。 降 低 扫 描 线 的 影响 可 简化 如 洋流 间 边 界 特 
征 的 检测 


a Dic 
图 4.51 ” (a) 显示 有 突出 扫描 线 的 图 像 ; (b) 使 用 Dy = 50 的 GLPF 对 图 像 滤波 后 的 结 
果 ; (c) 使 用 Dy = 20 的 GLPF 对 图 像 滤 波 后 的 结果 ( 原 图 像 由 NOAA 提供 ) 
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图 4.51(c) 显示 了 使 用 Do = 20 的 高 斯 低 通 滤波 器 对 图 像 滤 波 更 有 意义 的 结果 。 这 里 ， 对 图 像 滤 波 
的 目的 是 尽 可 能 模糊 更 多 的 细节 ， 而 保留 大 的 可 识别 特征 。 例 如 ， 这 种 类 型 的 滤波 可 以 作为 图 像 分 析 
系统 的 预 处 理 的 一 部 分 ， 该 系统 在 图 像 库 中 搜索 特征 。 具 有 这 种 特征 的 一 个 例子 可 能 是 给 定 大 小 的 湖 
泊 ， 例 如 佛罗里达 东南 部 的 奥 基 乔 比 湖 一 一 图 4.51(c) 中 的 一 个 近似 环形 的 暗 区 。 低 通 滤波 通过 消除 比 
感 兴趣 的 平均 特征 小 的 其 他 特征 来 简化 分 析 。 


4.9 使 用 频率 域 滤波 器 锐 化 图 像 


前 几 节 中 说 明了 通过 衰减 图 像 的 传 里 叶 变换 的 高 频 成 分 可 以 平滑 图 像 。 因 为 边缘 和 其 他 灰 度 的 急 
剧变 化 与 高 频 成 分 有 关 ， 所 以 图 像 的 锐 化 可 在 频率 域 通 过 高 通 滤波 来 实现 ， 高 通 滤波 会 衰减 傅 里 叶 变 
换 中 的 低频 成 分 而 不 会 扰乱 高 频 信 息 。 如 4.8 节 那 样 ， 我 们 仅 考 虑 径 向 对 称 的 零 相 移 滤波 器 。 本 节 中 
的 所 有 滤波 都 以 4.7.3 节 概 述 的 过 程 为 基础 ， 因 此 所 有 的 滤波 器 函数 Hu, v) 都 可 理解 为 大 小 为 PxO 的 
离散 函数 ， 即 离散 频率 变量 的 范围 是 vx=0, 1,2,---, P—1 Ml v=0, 1,2,---,O-1. 

一 个 高 通 滤波 器 是 从 给 定 低 通 滤波 器 用 下 式 得 到 的 : 

H yp (u,v) =1— Hyp (u,v) (4.9-1) 
式 中 ，Hip(w, 是 低 通 滤波 器 的 传递 函数 。 也 就 是 说 ,被 低 通 滤波 器 衰减 的 频率 能 通过 高 通 滤波 器 ， 反 
之 亦 然 。 

本 节 考 虑 理想 、 布 特 沃 斯 和 高 斯 高 通 滤波 器 。 如 前 几 节 所 示 ， 我 们 在 频率 域 和 空间 域 分 别 说 明 这 
些 滤波 器 的 特性 。 图 4.52 显示 了 这 些 滤波 器 的 典型 三 维 图 、 图 像 表 示 和 训 面 图 。 像 前 面 一 样 ， 我们 看 
到 ， 布 特 沃 斯 滤波 器 表现 为 理想 滤波 器 的 锐利 性 和 高 斯 滤波 器 的 宽阔 平滑 性 间 的 一 种 过 渡 。 紧 随 该 节 
后 面 的 讨论 ,图 4.53 说 明了 这 些 滤 波 咒 在 空间 域 的 形状 。 空 间 滤波 需 是 使 用 用 于 生成 图 4.43 和 图 4.46 
的 步骤 得 到 和 显示 的 。 


4.9.1 理想 高 通 滤波 器 
二 维 理想 高 通 滤 波 器 (IHPF) 定义 为 


0 D(u,v) < Dy 


; (4.9-2) 
l; D(u,v) > Dy 


H(u,v)= | 
AP, Do 是 截止 频率 ，D(wu, v) 由 式 (4.8-2) 给 出 。 这 个 表达 式 直 接 来 自 式 (4.8-1) 和 式 (4.9-1) 。 如 所 预料 
的 那样 ，IHPF 与 ILPF 是 相对 的 ， 在 这 种 情况 下 ，IHPF 把 以 半径 为 Do 的 圆 内 的 所 有 频率 置 零 ， 而 毫 
无 衰减 地 通过 圆 外 的 所 有 频率 。 如 同 ILPF 那样 ，IHPF 也 是 物理 上 无 法 实现 的 。 但 与 前 面 一 样 ， 我 们 
这 里 出 于 完整 性 对 它 进 行 讨论 ， 因 为 IHPF 可 以 用 来 解释 空间 域 中 的 振 铃 等 现象 ， 但 讨论 很 简要 。 
因为 它们 与 式 (4.9-1) 的 方法 有 关 ， 我 们 可 以 预料 IHPF 和 ILPF 一 样 具 有 相同 的 振 铃 上 性质， 这 清楚 地 
展示 在 图 4.54 中 ， 这 些 图 像 是 使 用 Do 分 别 为 30, 60 和 160 像素 的 各 种 IHPF 对 图 4.41 (a) 中 的 原始 图 像 滤 
波 后 的 结果 。 图 4.54 (a) 中 的 振 铃 现象 相当 严重 ， 以 至 于 产生 了 失真 ， 物 体 的 边界 也 被 加 粗 (看 一 下 那个 大 
字母 “a”)。 顶 部 3 个 圆 的 显示 也 不 是 很 好 ， 因 为 它们 不 像 图 像 中 的 其 他 边缘 那样 强 (这 3 个 目标 的 灰 度 
很 接近 于 背景 灰 度 ,产生 了 较 小 的 幅度 不 连续 ) 。 观 察 图 4.53 (a) 中 HPF 的 空间 表示 的 “点 ”的 大 小 ， 
记 住 ， 空 间 域 滤 波 是 空间 滤波 器 与 图 像 的 卷 积 ， 这 一 概念 可 以 帮助 解释 为 什么 较 小 的 物体 和 线条 几乎 显 
示 为 纯 白色 。 特 别 应 注意 图 4.54 (a) 中 最 上 一 行 的 3 个 小 方形 和 垂直 细 条 带 。 当 Do = 60 时 ， 情 况 有 
所 改善 。 边 缘 失 真 仍 很 明显 ， 但 现在 我 们 开始 看 到 对 于 较 小 物体 的 过 滤 。 由 于 现在 已 很 熟悉 频率 域 
和 空间 域 的 相反 关系 ， 我 们 知道 这 个 滤波 器 的 点 的 大 小 要 比 Do=30 的 滤波 器 更 小 。Do= 160 的 结果 
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更 像 一 幅 高 通 滤波 后 的 图 像 。 图 中 ， 边 缘 更 清晰 ， 失 真 更 小 ， 而 且 较 小 的 物体 已 被 正确 滤 除 。 当 然 ， 
所 有 图 像 的 恒定 背景 在 高 通 滤 波 后 的 图 像 中 都 是 i s 似 于 空间 域 中 的 差分 
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4.52 ”顶部 行 : 典型 理想 高 通 滤波 器 的 透视 图 、 图 像 表 示 和 前 面 图 ; 中 间 行 : BOM ATR MEUA 
的 透视 图 、 图 像 表 示 和 前 面 图 和 ; 底部 行 : 典型 高 斯 高 通 滤波 器 的 透视 图 、 图 像 表 示 和 剖面 图 








a b'c \ | 

图 4.53”(a) 典 型 的 频率 域 理 想 高 通 滤 波 器 的 空间 表示 及 通过 滤波 器 中 心 的 对 应 灰 度 剂 面 图 ; 
(b) 典型 的 频率 域 布 特 沃 斯 高 通 滤波 器 的 空间 表示 及 通过 滤波 需 中 心 的 对 应 灰 度 浏 面 图 ; 
(c) 典型 的 高 斯 频率 域 高 通 滤波 器 的 空间 表示 及 通过 滤波 口中 心 的 对 应 灰 度 前 面 图 306 
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abc 
图 4.54 使 用 Do= 30, 60 Al 160 的 IHPF 对 图 4.41 (a) 中 的 图 像 滤 波 后 的 结果 
49.2 布 特 沃 斯 高 通 滤波 器 
截止 频率 为 Du 的 寺 阶 布 特 沃 斯 高 通 滤波 器 (BHPF) 定义 为 
H (u,v) = ; : (4.9-3) 
1+ [D, /D(u, v)}" 
其 中 Du, y 由 式 (4.8-2) 给 出 。 该 表达 式 直接 来 自 式 (4.8-5) 和 式 (4.9-1) 。 图 4.52 的 中 间 一 行 显示 了 该 
BHPF 函数 的 图 像 和 剖面 图 
与 低 通 滤波 器 一 样 ， 我 们 可 以 预料 布 特 沃 斯 高 通 滤波 器 比 IHPF 更 平滑 Bt ep 显示 了 Do 值 
与 图 4.54 中 设置 相同 的 2 BY BHPF 的 特性 。 边 缘 失 真 比 图 4.54 小 得 多 ， 甚 至 对 于 最 小 的 截止 频率 值 
也 一 样 。 因 为 IHPF 和 BHPF 中 心 区 域 的 点 的 大 小 类 似 [ 见 图 4.53 (a) 和 图 4.53 (b) ]， 这 两 个 滤波 器 过 
滤 小 目标 的 性 能 可 以 比拟 。 截 止 频率 越 大 ， 使 用 BHPF 得 到 的 结果 就 越 平 滑 








abc 
图 4.55 使 用 [ 对 应 于 图 4.41 (b) PÉI | Do= 30, 60 F 160 H) 2 BF BHPF 对 图 4.41 (a) 
中 的 图 像 高 通 滤波 后 的 结果 。 这 些 结果 比 用 IHPF 得 到 的 结果 平滑 得 多 
4.9.3 高 斯 高 通 滤波 器 
截止 频率 处 在 距 频 率 矩 形 中 心 距 离 为 Do 的 高 斯 高 通 滤 波 器 (GHPF) 的 传递 函数 ， 由 下 式 给 出 : 
H(u,v) =1 — @ Puy) 2D; (4.9-4) 
Hh, D(u, 由 式 (4.8-2) 给 出 。 该 表达 式 直接 来 自 式 (4.8-7) 和 式 (4.9-1) 。 图 4.52 的 第 三 行 显示 了 GHPF K 
数 的 透视 图 、 图 像 和 剖面 。 沿 用 BHPF 相同 的 形式 ， 图 4.56 中 显示 了 使 用 GHPF 的 类 似 结果 。 正 如 所 
料 ， 得 到 的 结果 比 前 两 个 滤 ; 更 平滑 。 即 使 是 对 微小 物体 和 细 线 条 使 用 高 斯 滤波 顺 滤 波 , 结 


果 也 是 较 清 晰 的 。 表 4.5 总 结 了 本 节 讨 论 的 高 通 滤波 需 。 
a b c EBER 
305 图 4.56 {EA Do = 30, 60 和 160 的 一 个 GHPF 对 图 4.41(a) 中 的 图 像 进行 高 通 滤 波 后 


~ WEE, Dy 对 应 于 图 4.41 (b) 中 的 各 个 圆圈 。 请 与 图 4.54 和 图 4.55 进行 比较 
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表 4.5 高 通 滤波 器 。Do 是 截止 频率 ，n 是 布 特 沃 斯 滤波 器 的 阶 数 


















mz a 


D(u,v) < Dy 
D(u,v) > Dy 





布 特 沃 斯 
fire Saal 
1+ [D/Da v)]” 









0, : ; 
H(u,v)= H(u,v) = H(u,v)=1-e ™ 2D; 





1419 PASE. 

图 4.57 (a) 是 一 幅 大 小 为 1026 x 962 的 指纹 图 像 ， 其 污染 (一 种 典型 的 问题 ) 是 很 明显 的 。 自 动 指纹 识别 的 
关键 一 步 是 增强 指纹 的 痢 线 并 减 小 污染 。 增强 在 人 对 指纹 的 解释 方面 也 很 有 用 。 在 这 个 例子 中 ， 我 们 使 用 高 
通 滤波 法 来 增强 消 线 并 减 小 污染 效应 。 少 线 的 增强 使 用 消 线 包含 高 频 这 样 一 个 事实 来 完成 ， 而 高 通 滤 波 器 不 会 
改变 高 频 。 另 -方面 ， 滤 波 器 减少 了 低频 成 分 ， 而 低频 成 分 对 应 图 像 中 变化 缓慢 的 灰 度 ， 例 如 背景 和 污染 。 这 
样 ， 增 强 就 可 通过 减少 除 高 频 外 的 所 有 特征 来 达到 ， 在 这 种 情况 下 ， 高 频 是 感 兴趣 的 特征 。 

图 4.57 (b) 是 使 用 截止 频率 为 50 的 4 阶 布 特 沃 斯 高 通 滤波 器 滤波 后 的 
结果 。 如 期 望 的 那样 ,高通 滤波 后 的 图 像 失 去 了 它 的 灰 度 色调 ， 因 为 直流 | TO 本 二 大 上 为 下 因为 
项 已 被 减 小 为 0。 最终 结果 是 ， 高 通 滤波 后 的 图 像 中 ， 典 型 的 暗色 调 已 成 | 这样 会 训 减 低频 ， 但 低频 不 会 完全 消 
为 主流 , 因此 需要 额外 的 处 理 来 增强 感 兴 趣 的 细节 。 一 种 简单 的 方法 是 对 | 除 。 Do 在 短 维 的 2% 至 5% 是 一 个 不 
滤波 后 的 图 像 进行 阐 值 处 理 .图 4.57(c) 显示 了 将 滤波 后 的 图 像 中 的 所 有 负 OE 
值 设置 为 黑 、 将 所 有 正 值 设置 为 白 后 的 结果 。 注意 , 峭 线 已 变 清晰 ， 且 污染 明显 减 小 。 事实 上 ,图 4.57(a) 
所 示 图 像 右上 方 部 分 中 几乎 已 看 不 见 的 消 线 ， 在 图 4.57(e) 中 已 被 很 好 地 增强 。 








图 4.57 (a) 指纹 图 像 ;(b) 对 图 (a) 高 通 滤波 后 的 结果 ; (c) 对 图 (b) 进行 
阔 值 操作 后 的 结果 ( 原 图 像 由 美国 国家 标准 和 技术 研究 所 提供 ) 


4.9.4 频率 域 的 拉 普 拉 斯 算 子 
在 3.6.2 节 , 我 们 已 使 用 拉 普 拉 斯 算 子 对 空间 域 图 像 进行 了 增强 。 本 节 重 温 拉 普 拉 斯 算 子 ， 并 说 明 


它 可 得 到 与 频率 域 技术 的 等 效 结果 。 可 以 证 明 ( 见 习题 4.26) ， 拉 普 拉 斯 算 子 能 使 用 如 下 滤波 右 在 频率 


域 实现 : 
H(u,v) =—4n? (u? +’) | (4.9-5) 
或 者 ， 关 于 频率 矩形 的 中 心 ， 使 用 如 下 滤波 器 实现 : 
H(u,v) =—41 [ (wu —~P/2)? + (v-Q/2) | =~4n?D* (u,v) (4.9-6) 
IP, D(u, VÆ (4.8-2) 给 出 的 距离 函数 。 然 后 ， 拉 普 拉 斯 图 像 由 下 式 得 到 : 
V? f(x,y) = 3 {H(u,v)F(u, v)} (4.9-7) 
sth, F(u, VE f(x, DAREA. 41 3.6.2 节 描 述 的 那样 ， 增 强 可 使 用 下 式 实现 : 
g(x,y) = f(x,y) +eV f(x,y) (4.9-8) 
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这 里 , c=-1, 因为 Hu, vy) 是 负 的 ,在 第 3 章 中 , f(x 和 Vf(x,y) 具有 可 比 的 数值 。 然而 , 用 式 (4.9-7) 
HAV f(x,y) ah Dhl DFT, 这 些 系数 的 幅度 与 了 的 最 大 值 相 比 可 能 要 大 几 个 量 级 .这 样 ， 
f 与 其 拉 普 拉 斯 间 的 差别 一 定 会 被 带 入 可 比 的 范围 。 处 理 该 问题 的 简单 方法 是 ， 在 计算 fx, y DFT 
ees 将 f(x, yE pie J[0, 1] 内 , 并 用 它 的 最 大 值 除 V? f(x,y) , 进而 将 它 带 到 近似 区 间 [-1, 1] 
内 (回忆 可 知 拉 普 拉 斯 算 子 有 负 值 ) 。 然 后 ， 可 以 应 用 式 (4.9-8) 
在 频率 域 ， 式 (4.9-8) 可 写 为 


g(x, y)=S {F(u, v)—H(u,v)F(u,v)} = 3 ' ffl- H (u, v)]F (u,v)} = OT [1+ 4x? D’ (u,v) |F (u, v)} (4.9-9) 


一 结果 是 精致 的 ， 但 它 也 存在 刚刚 提 到 的 标定 问题 ， 并 且 归 一 化 系数 不 容易 计算 。 由 
于 这 一 原因 ,， 式 (4.9-8) 优先 选择 在 频率 域 中 实现 ,使 用 式 (4.9-7) HAV? f(xy). 并 用 前 节 提 到 的 
方法 来 标定 


例 4.20 使 用 拉 普 拉 斯 算 子 在 频率 域 锐 化 图 像 。 

图 4.58 (a) 是 与 图 3.38 (a) 相同 的 图 像 ， 图 4.58(b) 显示 了 使 用 式 (4.9-8) 后 的 结果 ， 其 中 拉 普 拉 斯 算 子 在 
频率 域 用 式 (4.9-7) 计算。 标定 使 用 与 公式 有 关 的 描述 来 完成 :比较 图 4.58(b) 和 图 3.38 (e), 我 们 可 以 看 到 ， 
频率 域 和 空间 域 的 结果 在 视觉 上 是 相同 的 。 很 明显 ， 在 这 两 幅 图 中 ， 对 应 于 图 3.37(b) 的 拉 普 拉 斯 模板 在 
中 心 有 一 个 系数 -8 (习题 4.26) 。 





图 4.58 (a) 原始 模糊 图 像 ， (b) 在 频率 域 中 使 用 拉 普 拉 斯 算 子 增强 后 的 图 像 。 请 与 图 3.38 (e) 比较 
4.9.5 钝 化 模板 、 高 提升 滤波 和 高 频 强 调 滤波 


本 节 讨 论 3.6.3 节 中 介绍 过 的 钝 化 模板 、 高 提升 滤波 图 像 锐 化 技术 。 使 用 频率 域 方法 ， 式 (3.6-8) 
中 定义 的 模板 由 下 式 给 出 : 


Sask (%>¥) =f y) Srp (x.y) (4.9-10) 


fip (xy) = ST" [Ap (u,v) F(u, v)] (4.9-11) 
AP, Hilu, v) 是 一 个 低 通 滤波 器 ，F (u,v) 是 了 (x,y) 的 依 里 叶 变 换 。 这 里 ，fip(x, 是 平滑 后 的 图 像 ， i 
图 像 类 似 于 式 (3.6-8) 中 的 f(x,y) 。 然 后 ， 如 式 (3.6-9) 那样 ， 有 

g(x, y) = f(x,y) +k* gr au (XY) (4.9-12) 
该 表达 式 定 义 了 k= 工时 的 钝 化 模板 和 大 > 1 时 的 高 提升 滤波 器 。 利 用 前 面 的 结果 ， 我 们 完全 可 以 使 用 


310| 涉及 低 通 滤波 器 的 频率 域 计 算 来 表达 式 (4.9-12) : 
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g(x,y) = 3 {1 +k *[] -Hip(u,v)]| F(u,v)} (4.9-13) 
用 式 (4.9-1) ， 我 们 可 以 根据 高 通 滤波 器 来 表达 该 结果 : 
g(x, y) = I" {[1+k* Hyp (u,v)] F(u, v)} (4.9-14) 
方 括号 中 的 表达 式 称 为 高 频 强调 滤波 器 。 如 前 面 提 及 的 那样 ， 高 通 滤波 器 将 直流 项 置 0， 因 此 会 把 滤 
波 后 的 图 像 的 平均 灰 度 减 小 为 0。 高 频 强 调 滤波 器 不 存在 这 一 问题 ， 因 为 高 通 滤波 器 上 加 了 1。 常 数 大 
给 出 了 影响 最 终结 果 的 高 频 的 比例 。 高 频 强 调 滤波 的 通用 公式 为 
g(x,y) = 3" {[k, +k, * Hyp (u,v)] F(u,v)} (4.9-15) 
其 中 , k>0 控制 距 原 点 的 偏 移 量 [ 见 图 4.31(c) |, B20 控制 高 频 的 贡献 
4.21 使 用 高 频 强调 滤波 增强 图 像 。 
图 4.59 (a) 显示 了 一 幅 大 小 为 416x596 的 胸部 X 射线 图 像 ， 其 灰 度 级 很 窗 。 本 例 的 目的 是 使 用 高 频 强 
调 滤波 增强 该 图 像 。 由 于 和 射线 不 能 使 用 光学 镜头 聚焦 ， 因 此 得 到 的 图 像 通常 都 会 稍微 有 些 模 糊 。 因 为 这 
幅 特 殊 图 像 的 灰 度 偏向 灰 度 级 的 暗 端 ,所 以 我 们 还 利用 这 个 机 会 给 出 一 个 如 何 使 用 空间 域 处 理 来 补充 频率 
meng 
e . `“ á é nee 在 医学 中 , 像 振 Í 
图 4.59 (b) 显示 了 使 用 Dy = 40( 大 约 为 填充 后 图 像 大 小 的 5%) 的 一 个 人 为 峡 陷 是 不 能 接受 的 因此 ,最 好 


高 斯 滤波 器 对 图 像 进行 高 通 滤 波 后 的 结果 。 如 预料 的 那样 ， 滤 波 的 结果 “| 避免 使 用 可 能 会 在 处 理 后 的 图 像 中 | 


没有 什么 特征 ， 但 胖 胱 地 显示 了 图 像 中 的 主 边缘 。 图 4.95 (c) 显示 了 高 频 | 引入 人 为 缺陷 的 滤波 器 。 因 为 空间 和 | 
频率 域 高 斯 小 波 器 是 傅 里 叶 变换 对 ， | 





强调 滤波 的 优点 ， 其 中 我 们 使 用 了 式 (4.9-15), Hh =0.5, 石 =0.75。 | 因此 这 些 滤波 器 会 产生 不 会 引入 人 | 
虽然 图 像 依旧 较 暗 ， 但 其 灰 度 级 色调 归 因 于 低频 成 分 而 未 丢失 。 | 为 缺 陶 的 平滑 结果 。 | 


如 3.3.1 节 讨 论 的 那样 ， 在 较 罕 范围 的 灰 度 级 中 ， 由 灰 度 级 表征 
的 图 像 是 直方 图 均衡 处 理 的 理想 候选 者 。 如 图 4.59(d) 所 示 ,， 这 的 确 是 进一步 增强 图 像 的 合适 方法 。 注 
意 骨 骼 结构 的 清晰 度 和 其 他 三 幅 图 像 中 均 不 可 见 的 细节 。 最 终 增强 后 的 图 像 有 点 噪声 ， 但 在 扩展 图 像 
的 灰 度 级 后 ， 这 是 XX 光 图 像 的 典型 现象 。 用 高 频 强调 和 直方 图 均衡 相 结合 得 到 的 结果 ， 优 于 用 任何 单 
独 方法 得 到 的 结果 。 






ab 

必 | We 

图 4.59 (a) 一 幅 胸 部 X 射线 图 像 ; (b) 使 用 高 斯 高 通 滤波 器 滤波 后 的 结果 。 (c) 使 用 
相同 滤波 器 进行 高 频 强调 滤波 后 的 结果 ; d@) 对 图 (c) 执 行 直方 图 均衡 操作 后 

的 结果 ( 原 图 像 由 密 软 根 大 学 医学 院 解 剖 科 学 部 的 Thomas R. Gest 博士 提供 ) 
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4.9.6 同 态 滤波 


2.3.4 节 中 介绍 的 照射 -反射 模型 可 用 于 开发 一 种 频率 域 处 理 过 程 ， 该 过 程 通过 同时 压缩 灰 度 范围 
和 增强 对 比 度 来 改善 一 幅 图 像 的 外 观 。 由 2.3.4 节 的 讨论 可 知 ， 一 幅 图 像 jx, y) 可 以 表示 为 其 照射 成 分 
(x, 了 和 反射 成 分 r(x, y) 的 乘积 ， 即 





f(x,y)=i(x, y)r(x, y) (4.9-16) 
上 式 不 能 直接 用 于 对 照射 和 反射 的 频率 成 分 进行 操作 ， 因 为 乘积 的 傅 里 叶 变换 不 是 变换 的 乘积 : 
3 f(x. »)] 4 Sli, y)]S [r(x, »)] (4.9-17) 
然而 ， 假 定 我 们 定义 如 果 砍 度 范围 为 [0, 1] 的 图 像 /Ge 
z(x,y)=Inf (x,y)=1n i(x, y)+1n r(x, y) (4.9-18) treed meme 
则 有 处 理 结束 时 ， 再 将 1 减 去 。 
3{z(x, y)} =F {In f(x, y)} = T{In i(x, y)}+ Ifin r(x, y)} (4.9-19) 
或 
Z(u,v) = F,(u,v) + F, (u,v) (4.9-20) 


IF, Fu, VAI (u,v) 分 别 是 In i, y) 和 In rx, y) 的 傅 里 叶 变 换 。 
我 们 可 以 用 滤波 器 Au, VXI Z(u, v) 滤 波 ， 故 有 
S(u,v) = H(u,v)Z(u,v) = H(u,v)F; (u,v)+ H(u,v)F, (u,v) (4.9-21) 
在 空间 域 中 ， 滤 波 后 的 图 像 是 
s(x, y) = I {S(u,v)} = I {A (u, v)F (u,v)} +3 {H (u, v)F, (u, v)} (4.9-22) 


由 定义 
i'(x,y)= I" {H (u, v)F, (u,v)} (4.9-23) 
和 
r'(x,y) = 3 {H(u,v)F,(u,v)} (4.9-24) 
我 们 可 以 下 列 形式 来 表达 式 (4.9-23) : 
s(x, y) =i'(x, y)+r'(x, y) (4.9-25) 


最 后 ， 因 为 z(x, yA AR HARRERA, Be EO NAR ts BOX — 
反 处 理 来 形成 输出 图 像 : 


Bh SO a ESM” = h(x Dey) (4.9-26) 
其 中 ， 
ip(x, y= &™ (4.9-27) 
和 
r(x, y=” (4.9-28) 


是 输出 (处 理 后 ) 图像 的 照射 和 反射 成 分 。 

刚刚 推导 的 滤波 方法 总 结 在 图 4.60 中 。 该 方法 是 以 称 之 为 同 态 系统 的 一 类 系统 的 特殊 情况 为 基础 
的 。 在 这 种 特殊 应 用 中 ,方法 的 关键 在 于 照射 成 分 和 反射 成 分 的 分 离 ， 其 实现 形式 如 式 (4.9-20) 所 示 。 然 
后 ， 如 式 (4.9-21) 指 出 的 那样 ， 同 态 滤波 函数 Hu, v) 可 分 别 对 这 些 成 分 进行 操作 。 
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fxy > nm [> DFT nl prl aw fo &(x,y) 


FA 4.60 ， 同 态 滤波 步 又 小 结 


图 像 的 照射 成 分 通常 由 慢 空 间 变 化 来 表征 ， 而 反射 成 分 往往 引起 突变 ,特别 是 在 不 同 物体 的 连接 
处 。 这 些 特性 导致 图 像 取 对 数 后 的 传 里 叶 变换 的 低频 成 分 与 照射 相 联系 ， 而 高 频 成 分 与 反射 相 联 系 。 
虽然 这 些 联系 只 是 粗略 的 近似 ,但 它们 用 在 图 像 滤波 中 是 有 益 的 ， 如 例 4.22 中 说 明 的 那样 。 

使 用 同 态 滤波 器 可 更 好 地 控制 照射 成 分 和 反射 成 分 。 这 种 控制 需要 指定 一 个 滤波 器 函数 Hu, v), È 
可 用 不 同 的 可 控 方 法 影响 传 里 叶 变换 的 低频 和 高 频 成 分 。 图 461 显示 了 这 种 滤波 器 的 剖面 图 。 如 果 j 
PE, My < 1 E> 1, 那么 图 4.61 所 示 滤 波 器 函数 趋向 于 衰减 低频 (照射 ) 的 贡献 , 而 增强 高 频 ( 反 
射 ) 的 贡献 。 最 终结 果 是 同时 进行 动态 范围 的 压缩 和 对 比 度 的 增强 。 

图 4.61 所 示 的 函数 形状 可 用 高 通 滤波 器 的 基本 形式 来 近似 。 例 如 ， 采 用 形式 稍微 变化 一 下 的 高 斯 
高 通 滤 波 器 可 得 到 函数 





H(u,v) = (Yy - niet" lay, (4.9-29) 


Hp, D(u, ) 由 式 (4.8-2) 定 义 ， 常数 c 控制 函数 边 坡 的 锐利 度 ， 它 在 yj; Aly, 之 间 过 渡 。 这 个 滤波 器 
类 似 于 前 节 讨论 的 高 频 强 调 滤波 器 。 


H (u,v) 





D(u, v) 
图 4.61 圆 形 对 称 同 态 滤波 器 函数 的 径 向 剖面 图 。 垂 直 轴 位 于 频率 矩形 的 中 心 ，PD(we v) 是 距 中 心 的 距离 
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图 4.62 ” (a) 全 身 PET 扫描 图 像 ; (b) 用 同 态 滤波 增强 的 图 像 ( 原 图 
像 由 CTIPET Systems 公司 的 Michael E. Casey 博士 提供 ) 


4.10 ”选择 性 滤波 


前 两 节 讨 论 的 滤波 器 在 整个 频率 矩形 上 操作 。 在 很 多 应 用 中 , 它们 的 目的 是 处 理 指定 频段 或 频率 矩形 
的 小 区 域 。 第 一 类 滤波 器 分 别称 为 带 阻 滤波 器 或 带 通 滤波 器 ， 第 二 类 滤波 需 称 为 陷 波 滤波 器 


4.10.1 带 阻 滤波 器 和 带 通 滤波 器 
这 种 类 型 的 滤波 器 很 容易 使 用 前 两 节 的 概念 来 构建 。 表 4.6 给 出 了 理想 、 布 特 沃 斯 和 高 斯 带 阻 滤 


波 器 的 表达 式 , 其 中 D (u,v) 是 距 频 率 和 矩形 中 点 的 距离 ,如 式 (4.8-2) 给 出 的 那样 , Do 是 带宽 的 径 向 中 心 ， 
W tT. B 4.63 (a) 以 图 像 形式 显示 了 一 个 高 斯 带 阻 滤波 器 ， 其 中 黑色 是 0， 白色 是 1 


表 4.6 带 阻 滤波 器 。W 是 带宽 ，D 是 Du, v) 距 滤波 器 中 心 的 距离 ，Do 是 截止 频率 ， 
n 是 布 特 沃 斯 滤波 器 的 阶 数 。 为 简化 表 中 符号 的 表示 ， 我 们 用 DANE D(u, v) 


理 想 布 特 沃 斯 高 斯 
l 
















7 w wW y 
lo, #7 D -—<D<D,+— H (u,v) =——_———- [p-p 
H(u,v) =4 2 2 | DW [on 
; l+ > -> H(u,v)=1-e 
1 其 他 | D? =D? 





用 由 低 通 滤波 器 得 到 高 通 滤波 器 的 相同 方法 ， 由 带 阻 滤波 器 我 们 得 到 带 通 滤波 器 : 
Hyp (u,v) =1— Hpg (u,v) (4.10-1) 
图 4.63 (b) 以 图 像 形式 显示 了 一 个 高 斯 带 PERE 


ab 





图 4.63 (a) +B EY b) 相应 的 带 通 滤波 器 。 为 清晰 起 见 ， 图 (a) 中 添加 了 细 黑 边 ， 它 不 是 数据 的 一 部 分 
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4.10.2 ” 陷 波 滤波 器 


陷 波 滤波 器 是 更 有 用 的 选择 性 滤波 器 。 陷 波 滤波 融 拒 绝 (或 通过 ) 事 先 定义 的 关于 频率 矩形 中 心 的 一 

个 邻 域 的 频率 。 零 相 移 滤波 器 必须 是 关于 原点 对 称 的 ,因此 , 一 个 中 心 位 于 (wo, wm) 的 陷 波 在 位 置 (-w, —vo) 

ose tne 的 陷 波 。 陷 波 带 阻 滤波 器 可 以 用 中 心 已 被 平移 到 陷 波 滤波 器 中 心 的 高 通 滤波 器 的 乘积 
来 构造 。 一 般 形式 为 


Q 
Hyr (u,v) = | | H, 0, v)H (u,v) (4.10-2) 
k=1 
sth, Ayu, VW) 和 Hx(w, v) RES, EMT DSP SIE (u,,v,) Pup v) 。 这 些 中 心 是 根据 频 
率 矩 形 的 中 心 (M12, W2) 确 定 的 。 对 于 每 个 滤波 器 ， 距 离 的 计算 由 下 式 执行 : 


DiGey=[w-M/12-zj2+G-N/2-w] (4.10-3) 
和 
2 22 
D.,(u,v)=[(u-M/2+u,) +(v-N/24+y) | (4.10-4) 
例如 ， 下 面 是 一 个 n 阶 布 特 沃 斯 陷 波 带 阻 滤波 器 ， 它 包含 三 个 陷 波 对 : 
1 
Hyp (u, SS ee | eee ee (4.10-5) 
xen ewes lanl 


其 中 ,Di 和 DRI (4.10-3) 和 式 (4.10-4) 给 出 。 常 数 Do 对 每 个 陷 波 对 都 是 相同 的 ， 但 对 于 不 同 的 陷 
波 对 ， 它 可 以 不 同 。 其 他 陷 波 带 阻 滤波 器 可 用 相同 的 方法 构建 ， 具 体 取 决 于 所 选 的 高 通 滤波 器 。 正 如 
早期 讨论 的 滤波 器 那样 ， 陷 波 带 通 滤波 器 可 使 用 下 式 由 陷 波 带 阻 滤波 器 得 到 ， 


Hyp (u,v) = 1— Hyp (u,v) (4.10-6) 


如 接 下 来 的 三 个 例子 所 示 ， 陷 波 滤波 的 主要 应 用 之 一 是 , 选择 性 地 修改 DFT 的 局 部 区 域 。 这 种 类 
型 的 典型 处 理 是 交互 完成 的 ， 它 直接 对 DFT 处 理 ， 而 不 需要 填充 。 交 互 处 理 实际 的 DFT( 相 对 于 必须 
从 填充 “平移 ”到 实际 频率 值 来 说 ) 的 优点 是 , 不 会 出 现 因 在 滤波 处 理 中 未 使 用 填充 而 导致 的 任何 缠绕 
错误 。 此 外 ， 如 5.4.4 节 中 将 说 明 的 那样 ， 陷 波 滤 波 技术 比 这 里 讨论 的 以 无 填充 的 DFT 为 基础 的 技术 
更 有 用 。 要 了 解 随 填 充 函 数 变化 的 DFT 的 概念 ， 见 习题 4.22。 
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图 4.64 (a) 显示 了 葛 尔 模式 的 取样 过 的 报纸 图 像 ; \b) 该 图 像 的 谱 ; (c) 布 特 
沃 斯 陷 波 带 阻 滤波 咒 乘 以 传 里 叶 变换 后 的 结果 ; (d) 滤波 后 的 图 像 


$4.24 ”使 用 陷 波 滤波 增强 “ 卡 西 尼 ”号 拍摄 的 土星 图 像 。 

图 4.65 (a) 显示 了 部 分 环绕 土星 的 土星 环 的 图 像 。“ 卡 西 尼 ”号 飞船 首次 进入 该 行星 的 轨道 时 , 拍摄 了 
这 幅 图 像 。 垂 直 的 正弦 模式 是 在 对 图 像 数 字 化 之 前 ， 由 又 加 到 摄影 机 视频 信号 上 的 交流 信号 造成 的 。 这 是 
一 个 人 们 未 曾 料 到 的 问题 ， 它 污染 了 来 自 某 些 任务 的 图 像 。 所 幸 的 是 ， 这 些 类 型 的 干扰 很 容易 使 用 后 处 理 
方法 来 校正 。 一 种 方法 就 是 使 用 陷 波 滤波 。 

图 4.65 (b) 显示 了 DET if. 仔细 分 析 垂 直 轴 会 发 现 一 系列 小 能 量 脉 冲 ， 这 些 脉冲 对 应 于 近似 正弦 曲线 
的 干扰 。 一 种 简单 的 方法 是 使 用 宕 陷 波 矩形 滤波 器 ， 它 从 最 低频 脉冲 开始 ， 并 扩展 到 垂直 轴 的 剩余 部 
分 。 图 4.65 (c) 显示 了 这 样 一 个 滤波 器 (白色 代表 1, 黑色 代表 0) 。 图 4.65 (d) 显示 了 使 用 该 滤波 器 对 污染 图 
像 滤波 后 的 结果 。 该 结果 与 原 图 像 相 比 有 较 大 的 改进 ; 

我 们 用 陷 波 带 通 滤波 器 | 见 图 4.66 (a) ] 隔离 了 垂直 轴 上 的 频率 。 人 然后， 如 图 4.66 (b) 所 示 ， 使 用 这 些 
频率 的 IDFT 得 到 了 空间 干扰 模式 本 身 。 








FA 4.65 (a) 显示 了 近似 周期 性 干扰 的 土星 环 图 像 ， 图 像 大 小 为 674 x 674 像素 ; (bi: 垂直 轴 上 靠近 原点 
的 对 应 干扰 模式 的 能 量 脉冲 ; 〈c) 一 个 垂直 陷 波 带 阻 滤波 器 ; (d) 滤波 后 的 结果 。 图 (ec) 中 的 细 黑 边 
是 为 清楚 起 见 而 添加 的 ， 它 不 是 数据 的 一 部 分 ( 原 图 像 由 NASA/JPL 的 Robert A. West 博士 提供 ) 





图 4.66 ” (a) 对 图 4.65 (a) 应 用 隐 波 带 通 滤波 器 后 的 结果 ( 谱 ) ; (b) 通过 计算 (a) 的 IDFT 而 得 到 的 空间 模式 
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4.11 实现 


迄今 为 止 , 我 们 的 注意 力 集中 在 频率 域 滤波 的 理论 概念 和 实例 上 。 现在 , 需要 清楚 的 一 件 事情 是 ， 
图 像 处 理 领 域 的 计算 要 求 并 不 是 微不足道 的 。 因 此 ， 推 导 一 些 基本 方法 很 重要 ， 这 些 基 本 方法 可 简化 
传 里 叶 变换 的 计算 ， 并 加 快 计算 速度 。 本 节 将 处 理 这 些 问 题 。 


4.11.1 二 维 DFT 的 可 分 性 
如 表 4.2 提 到 的 那样 ， 二 维 DFT 可 分 成 一 维 变换 。 我 们 可 以 把 式 (4.5-15) 写 为 


M-I N- M- 
F(u,v)= 280 Slee Pp = 2 F(x, yje oaii (4.11-1) 
x=0 y=0 x=0 
式 中 ， 
N- | 
Rd yy (me (4.11-2) 


y=0 
对 于 x 的 每 个 值 和 v=0, 1,2,---,N-1, 我 们 看 到 , F(x,v) 就 是 f(x,y) 的 行 的 一 维 DFT。 在 式 (4.11-2) 中 , X 
从 0 到 M1 变化, 我们 对 f(x,y) 的 所 有 行 计算 一 组 一 维 DFT。 类 似 地 ， 在 式 (4.11-1) 中 的 计算 是 下 (Gx,v) 
的 列 的 一 维 变换 。 

这 样 ， 我 们 就 得 出 结论 : f(x, ») 的 三 维 DFT 可 通过 计算 fx, y) 的 每 一 行 的 一 维 变换 ， 然 后 沿 计算 
结果 的 每 一 列 计算 一 维 变 换 来 得 到 。 这 是 一 个 重要 的 简化 ， 因 为 我 们 必须 一 次 只 处 理 一 个 变量 。 类 似 
地 , 我 们 可 用 一 维 IDFT 来 计算 二 维 IDFT。 然而 ,如 下 节 所 示 , 我 们 【我 人 可 以 _ 维 列 杰 次 和 - 维 行 变换 的 
可 以 用 计算 DFT 所 设计 的 算法 来 计算 IDFT。 形式 来 表示 式 (4.11-1) 和 式 (4.11-2) 。 最 


4.11.2 用 DFT 算法 计算 IDFT 
取 式 (4.5-16) PRA Sete, JRL MN 得 到 


M-I N-1 


MNF (x,y) = >) >) F* pe Pm) (4.11-3) 


u=0 v=0 





终结 果 是 相同 的 。 


但 是 ,我 们 看 出 该 结果 右边 的 形式 类 似 于 F (u, y 的 DFT。 因 此 , 式 (4.11-3) | 。 在 这 种 推导 中 乘 以 MN 的 假设 是 针 
指出 ， 如 果 把 F (u, v) 代 入 计算 二 维 传 里 叶 正 变换 所 设计 的 算法 中 ， | 对 式 (4.5-15) 和 式 (4.5-16) 的 形式 的 。 
结果 将 是 MN “Ge, 力 。 取 复 共 轿 并 将 该 结果 乘 以 MN， 将 得 到 een ete 
f(y), CE Fu, v) 的 反 变 换 。 

由 (前 节 介绍 的 ) 基于 逐次 通过 一 维 变换 的 二 维 正 DFT 算法 来 计算 二 维 反 变换 的 方法 ,是 导致 混乱 
的 一 种 常见 原因 , 因为 这 涉及 复 共 斩 和 乘 以 一 个 常数 的 计算 ,而 在 一 维 算 法 中 这 两 种 计算 都 不 会 涉及 。 
应 记 住 的 一 个 关键 概念 是 ， 我 们 只 需 简单 地 将 F“(u, v) 输 入 已 有 的 正 向 算法 中 。 结 果 将 是 MN (x,y). 
要 得 到 了 (x, 妨 这 一 结果 ,我们 只 需 取 它 的 复 共 斩 并 乘 以 一 个 常数 MN。 当 然 ， 当 (x,y) 是 实数 时 ， 典 
型 的 情况 是 了 (x, y)=f (x,y»)。 


4.11.3 ”快速 傅 里 时 变换 (FFT) 


如 果 我 们 必须 直接 实现 式 (4.5-15) 和 式 (4.51-16) ， 那 么 在 频率 域 工作 并 不 实际 。 这 些 公式 的 大 规 
模 运 算 要 求 约 (MN) 次 求 和 及 加 法 操作 。 对 于 中 等 大 小 的 图 像 ( 壁 如 1024x1024 像素 ) ， 这 意味 着 仅 进行 
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一 次 DFT 就 需要 万 亿 次 量 级 的 乘法 和 加 法 , 还 不 包括 指数 运算 , 指数 运算 可 被 计算 一 次 并 存储 在 查找 表 


中 。 即 使 是 对 超级 计算 机 来 说 ， 这 也 是 一 种 挑战 。 在 人 们 未 发 现 快速 传 里 叶 变 换 (FFT) 前 ， 可 以 说 本 章 
的 内 容 基 本 不 具有 实践 价值 ， 快 速 傅 里 叶 变换 可 将 乘法 和 加 法 的 次 数 降 到 MN logpMN。 由 FFT 提供 的 
计算 量 的 减少 的 确 令 人 印象 深刻 。 例如， 计算 大 小 为 1024x1024 的 图 像 的 二 维 FFT， 只 需要 约 2000 
万 次 乘法 和 加 法 运算 ， 与 前 面 提 到 万 亿 次 乘法 与 加 法 运算 相 比 ， 降 低 非常 明显 。 

虽然 FFT 是 信和 号 处 理 文献 中 广泛 涵盖 的 主题 , 但 这 一 主题 在 本 章 中 也 非常 重要 ， 如 果 我 们 不 提供 
至 少 介 绍 FFT 是 如 何 工作 的 说 明 , 那么 本 章 也 将 不 完整 。 我 们 选择 完成 这 一 目的 的 算法 称 为 逐次 加 信 
方法 ， 它 是 导致 整个 产业 诞生 的 原始 算法 。 这 种 特殊 算法 假定 取样 数 是 2 的 整数 次 需 ， 但 这 不 是 其 他 
方法 的 通用 要 求 (Brigham[1988]) 。 由 4.11.1 节 可 知 ， 二 维 DFT 可 以 使 用 逐次 一 维 变换 的 方法 来 执行 ， 
因此 我 们 仅 需 关注 一 个 变量 的 FFT。 

在 推导 FFT 时 ,习惯 上 将 式 (4.4-6) 表达 为 如 下 形式 : 


M-1 
Fuj= 2 SMe (4.11-4) 
> x=0 
式 中 , u=0,1, --,M-1, BR, 
Wy =e 28M (4.11-5) 
且 假 设 M 具 有 如 下 形式 : 
M =22 (4.11-6) 
其 中 入 是 一 个 正 整 数 。 因 此 ，M 可 表示 为 
M=2K (4.11-7) 
玉 也 是 一 个 正 整数 。 将 式 411-7) FEA ZK (4.11-4) 得 到 
2K-1 K- K-1 
Fu)= > SOM = > SOME? +> fx DA? (4.11-8) 
x=0 x=0 x=0 
然而 ， 使 用 式 (4.11-5) 可 以 证 明 WZ =W, BER (4.11-8) 可 以 表示 为 
K-1 K- 
FUu)= >》 f2xWE +Y f2x+ DWe Wak (4.11-9) 
x=0 x=0 
定义 
K-l 
Foren (4) = >) COW (4.11-10) 


x=0 


AH, w=0,1,2,---,K-1, Al 


K-1 
Faal) =X f 2x + DWE (4.11-11) 


x=0 


式 中 ，x = 0, 1, 2,…, 天 -1， 将 式 (4.11-9) 简化 为 
F(u) = Fen (U) + F ga (UW) Wx (4.11-12) 
ISh, BAW =Wh W = Wy, ， 式 (4.11-10) 到 式 (4.11-12) 给 出 


F(u+ K) = Foye (U) — Faa (Wik (4.11-13) 
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分 析 式 (4.11-10) 到 式 (4.11-13) 可 以 发 现 这 些 表达 式 的 一 些 有 趣 特性 。 如 式 (4.11-12) 和 式 (4.11-13) 指出 
的 那样 ， 一 个 M 点 变换 可 以 通过 把 原始 表达 式 分 解 为 两 部 分 来 计算 。 计 算 F(w) 的 前 一 半 要 求 计算 
式 (4.11-10) 和 式 (4.11-11) 中 给 出 的 两 个 (M/2) 点 变换 s 然后 , 将 结果 即 Fyen (U) F Fogg (u) 的 值 代入 
I (4.11-12) $8] F (u), u = 0, 1, 2,---, (2-1)。 再 后 ， 可 由 式 (4.11-13) 直接 计算 FF(w) 的 男 一 半 ， 而 不 
需要 额外 的 变换 计算 。 

为 检验 该 步骤 的 计算 量 , 令 m(n) 和 a(n) 分 别 表 示 实 现 算法 所 要 求 的 复数 乘法 次 数 和 加 法 次 数 。 如 
前 所 述 ， 样 本 数 为 2?，n 为 正 整数 。 先 假设 n= 1。 两 点 变换 要 求 计算 FO); 然后 F(1) 由 式 (4.11-13) 得 
到 。 为 得 到 F(0)， 要 求 计算 Fea(0) 和 Feaa(0)。 此 例 中 天 = 1 且 式 (4.11-10) 和 式 (4.11-11) 是 单 点 变换 。 
然而 ， 由 于 单个 样本 点 的 DFT 是 该 样本 自身 ， 故 得 到 Fyn(0) 和 Fosa(0) 不 需要 任何 乘法 和 加 法 运算 。 
Fae(0) 与 而 的 一 次 相 乘 和 一 次 加 法 ， 即 可 由 式 (4.11-12) 得 到 FO), 然后 ， 由 式 (4.11-13) 得 到 FU), 又 
用 了 一 次 加 法 (减法 可 以 认为 与 加 法 相同 ) 。 因 为 已 计算 过 环 y4(0)W ， 故 两 点 变换 所 需要 的 总 运算 次 
BA m(1)=1 次 乘法 和 a(1)=2 次 加 法 。 

n 的 下 一 个 允许 值 为 2。 根据 前 面 的 推导 , 一 个 4 点 变换 可 分 成 两 部 分 。F(w) 的 前 半 部 分 要 求 计算 
两 个 两 点 变换 , 如 K=2 时 式 (4.11-10) 和 式 (4.11-11) 给 出 的 那样 。 如 前 一 段 中 解释 的 那样 , 一 个 两 点 变 
换 要 求 m(1) 次 乘法 和 a(1) 次 加 法 ， 因 此 这 两 个 等 式 的 计算 总 共 要 求 2m(1) 次 乘法 和 2a(1) 次 加 法 。 要 从 
xh (4.11-12) 34 F (OF F (1), 还 需要 两 次 乘法 和 加 法 。 因 为 Eg (WW, 在 u= {0, 1} 时 已 被 计算 过 ， 
所 以 要 得 到 F(2) 和 F(3) 又 要 进行 两 次 加 法 计算 。 这 时 ， 总 运算 次 数 是 m(2)= 2m(1) + 2 次 乘法 和 a(2) = 
2a(1)+4 次 加 法 。 

当 n=3 时 ,计算 F ovn) A KaaGo0 时 会 用 到 两 个 4 点 变换 。 它 们 需要 2m(2) 次 乘法 和 2a(2) 次 加 法 。 
完成 全 部 变换 还 要 4 次 乘法 和 8 次 加 法 运算 。 总 运算 次 数 为 m(3)= 2m(2) + 4 HAKAN a(3) = 2a(2) + 8 
次 加 法 。 

对 任意 正 整 数 n 计算 这 些 参量 ,推导 出 完成 FFT 所 需 乘 法 和 加 法 次 数 的 递归 表达 式 为 


m(n)=2m(n-1)+2"" n21 (4.11-14) 
和 
a(n)=2a(n-1)+2" n>1 (4.11-15) 


其 中 ，m(O)=0 且 a(0)=0， 因 为 单 点 变换 无 须 任何 加 法 和 乘法 运算 。 

式 (4.11-10) 至 式 (4.11-13) 的 实现 构成 了 逐次 加 倍 的 FFT 算法。 这 一 名 称 来 自如 下 计算 方法 : 对 于 
任意 的 2 的 整数 次 宕 的 M， 一 个 两 点 变换 来 自 两 个 单 点 变换 ， 一 个 4 点 变换 来 自 两 个 两 点 变换 ， 以 此 
类 推 ， 直 到 M 为 2 的 整数 次 震 的 情形 。 作 为 练习 (见习 题 441)， 请 读者 证 明 








m(n) = im log, M (4.11-16) 
All 
a(n)=M log, M (4.11-17) 
与 直接 计算 一 维 DFT FALL, FFT 的 计算 优势 定义 为 
2 
c(M) = es d (4.11-18) 


M log, M is log, M 
因为 假定 有 M=2"， 所 以 可 将 式 (4.11-18) 写 为 关于 nn 的 形式 : 


Ses] 
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c(n) = 2 (4.11-19) 2400 
n 


图 4.67 显示 了 该 函数 的 曲线 。 作 为 n 的 函数 ， 迅 速 增 1800 
加 的 计算 优势 是 明显 的 。 例 如 ， 当 n=15(32 768 点 ) 
时 ，FFT 与 DFT 相 比 有 接近 2200:1 的 优势 。 这 样 ， C(n) 1200 
我 们 可 以 预料 在 同一 台 机 器 上 , FFT 的 计算 速度 会 比 
DFT 的 计算 速度 快 近 2200 倍 。 600 
涵盖 FFT 细节 的 优秀 文献 很 多 ， 因 此 此 处 不 再 深 
入 地 讨论 这 一 主题 (例如 ,可 参阅 Brigham[1988]) 。 SE 
际 上 ， 所 有 综合 性 的 信号 和 图 像 处 理 软件 包 都 已 包含 
FFT 的 实现 , 也 能 够 处 理 点 数 不 为 2 的 整数 次 寡 的 情 。 图 4.67 FFT 相对 于 直接 实现 一 维 DFT 的 计算 
况 (以 辆 牲 计算 效率 为 代价 ) 。 免 费 的 FFT 程序 也 可 优势 。 注 意 ， 该 优势 以 n 的 函数 快速 增长 
以 从 Intemet 上 得 到 。 


4.114 ”关于 滤波 器 设计 的 一 些 注释 

本 章 中 讨论 的 滤波 方法 严格 基于 基础 知识 ， 重 点 是 尽 可 能 清楚 地 解释 频率 域 滤波 的 效果 。 除 了 这 
样 做 之 外 ， 我 们 知道 没有 更 好 的 方法 来 处 理 滤波 问题 。 我 们 可 将 这 种 处 理 方式 视 为 “原型 化 ”一 个 滤 
波 器 的 基础 。 换 名 话说 ， 若 给 出 一 个 我 们 需要 找到 一 种 滤波 器 来 解决 的 问题 ， 那 么 频率 域 方法 是 一 种 
试验 、 快 速 及 完全 控制 滤波 器 所 有 参数 的 理想 工具 。 

一 旦 找到 适用 于 某 个 应 用 的 滤波 器 , 通常 会 使 用 固件 和 /或 硬件 直接 在 空间 域 实现 该 滤波 器 。 该 主 
题 超出 了 本 书 的 范围 。Petrou and Bosdogianni[1999] 给 出 了 二 维 频 率 域 滤波 器 和 相应 数字 滤波 器 之 间 的 
良好 联系 。 关 于 二 维 数字 滤波 器 的 设计 ， 请 参阅 Lu and Antoniou[1992]。 








0 — | 
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小 结 


本 章 循序 渐进 地 介绍 了 取样 、 传 里 叶 变换 和 频率 域 滤波 。 某 些 概念 ， 如 取样 定理 ， 如 果 没有 频率 
域内 容 的 解释 ， 几 乎 没有 意义 。 混 消 效 应 同样 如 此 。 因 此 ， 前 面 几 节 中 介绍 的 内 容 ， 是 理解 数字 图 像 
处 理 基 本 原理 的 坚实 基础 。 我 们 特别 注意 用 基本 原理 来 开始 内 容 的 阐述 ， 因 此 许多 具有 现代 数学 背景 
的 读者 不 仅 可 以 尽 可 能 地 吸收 这 些 材料 ， 而 且 还 可 应 用 它们 。 

本 章 的 第 二 个 目的 是 阐述 离散 传 里 叶 变 换 及 其 在 频率 域 滤波 中 的 应 用 。 为 实现 这 一 目标 ， 我 们 介 
绍 了 卷 积 定理 。 这 一 结果 是 线性 系统 的 基础 ， 也 是 第 5 章 中 将 要 介绍 的 复原 技术 的 基础 。 我 们 讨论 过 
的 滤波 器 类 型 是 在 实践 中 发 现 的 代表 性 滤波 器 。 然 而 ， 对 于 这 些 滤波 器 ， 关 键 是 说 明 用 公式 形式 来 表 
达 并 在 频率 域 实现 有 多 么 简单 。 尽 管 一 种 典型 解决 方案 的 最 终 实现 还 是 以 空间 滤波 器 为 基础 的 ， 但 工 
作 于 频率 域 所 获得 的 知识 对 于 选择 空间 滤波 器 来 说 大 有 神 益 。 

虽然 本 章 中 的 多 数 滤波 例子 是 在 图 像 增强 领域 ， 但 这 些 过 程 本 身 是 通用 的 ， 并 且 广 泛 用 于 后 续 章 节 。 


参考 文献 
4.1 节 所 讲 内 容 的 附加 读物 见 Hubbard[1998]。Bracewell[2000，1995] 介 绍 了 连续 傅 里 叶 变换 及 其 二 维 


图 像 处 理 。 除 Lim[1990], Castleman[1996], Petrou and Bosdogianni[1999]，Brigham[1988] 和 Smith[2003]， 
这 两 本 图 书 为 4.2 节 到 4.6 节 的 大 部 分 内 容 提供 了 背景 知识 。 关 于 莫 尔 模式 的 早期 工作 综述 ， 请 参阅 Oster 
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and Nishijima[1963]。Creath and Wyant[1992] 讨 论 了 30 年 后 该 领域 的 技术 状况 。4.5 节 讨 论 的 取样 、 混 淆 和 
图 像 重 建 问题 也 是 计算 机 图 形 学 中 感 兴趣 的 主题 ， 正 如 Shirley[2002] 举 例 说 明 的 那样 。 

4.7 节 到 4.11 节 内 容 的 附加 背景 材料 ,可 参阅 Castleman[1996], Pratt[2001] 和 Hall[1979]。 要 了 解 “ 卡 
西 尼 ” 号 太空 飞船 ( 见 4.10.2 节 ) 中 成 像 传感器 的 更 多 内 容 , 请 参阅 Porco, West et al.[2004]。 滤波 器 实现 的 
有 效 处 理 问题 (如 振 铃 ) 一 直 是 令 人 感 兴 趣 的 主题 , 详 见 Bakir and Reeves[2000]。 关于 钝 化 模板 和 高 频 强 调 
滤波 , IL Schowengerdt[1983]。 同 态 滤 波 ( 见 4.9.5 节 ) 的 内 容 基于 Stockham[1972], 也 可 参见 Oppenheim and 
Schafer[1975] 和 Pitas and Venetsanopoulos[1990]。Brinkman et al.[1998] 结 合 钝 化 模板 和 同 态 滤波 ， 增 强 了 
核磁 共振 图 像 。 

如 4.1.1 节 注 释 的 那样 , 作为 信号 处 理 基 础 工具 的 DFT 的 普及 , 快速 傅 里 叶 变换 的 发 现 (4.11.3 节 ) 是 一 
个 重要 的 里 程 碑 。 4.11.3 节 中 介绍 的 FFT 基于 Cooley and Tuckey[1965] 和 Brigham[1988], 他 们 也 讨论 了 FFT 
的 实现 ， 包 括 非 基 2 的 情况 。 快 速 傅 里 叶 变换 的 公式 表达 通常 认为 由 Cooley and Tukey[1965] 创 造 。 但 FFT 
的 有 趣 历 史 在 此 值得 一 提 。 作 为 对 Cooley and Tuckey[1965] 的 响应 ，Rudnick[1966] 提 出 了 一 种 类 似 的 技术 ， 
这 种 技术 的 运算 量 同样 与 NogzN 成 正比 ， 并 且 基 于 Danielson and Lanczos[1942]。 这 些 作 者 依次 参考 了 
Runge[1903, 1905]。 稍 后 的 两 篇 论文 和 Runge and König[1924] F, 包含 了 现代 快速 傅 里 叶 变换 算法 的 基本 计算 
优势 .Yates[1937],Stumpft[1939],Good[1958] 和 Thomas[1963] 也 发 表 过 类 似 的 技术 .1965 年 ,在 Cooley-Tukey 
的 论文 发 表 前 ，Cooley, Lewis and Welch[1967a] 对 快速 传 里 叶 变 换 进 行 了 历史 性 的 概括 ， 并 对 各 种 结果 进行 
了 有 趣 的 对 比 。 

4.11.3 节 介 绍 的 FFT 算法 来 自 Cooley and Tukey[1965]， 补 充 读物 见 Brigham[1988] 和 Smith[2003]。 本 
章 中 讨论 的 基于 频率 域 的 数字 滤波 器 的 设计 ( 见 4.11.4 节 ) ， 请 参阅 Lu and Antoniou [1992] 和 Petrou and 
Bosdogianni[1999]。 4.7 节 到 4.11 节 讨 论 的 许多 软件 实现 方法 , 见 Gonzalez, 
Woods and Eddins[2004]。 SD 标 有 星 号 习题 的 详细 解答 可 


在 本 书 的 网 站 上 找到 。 该 网 站 上 还 包 
含有 基于 本 章 内 容 而 建议 的 项 目 。 





4.1 重复 例 4.1, 但 使 用 函数 f(D) =24(-W4 < t< WIA) S(t) = 0， 对 于 其 他 所 有 的 ! 值 。 对 你 的 结果 和 
例子 中 的 结果 之 间 的 任何 不 同 ， 解 释 原 因 。 
*4.2 证明 式 (4.4-2) PAY E(u) 在 两 个 方向 上 是 无 限 周期 的 ， 周 期 为 AT o 
*4.3 ”可 以 证 明 (Bracewell[2000]) 1<> 5(u) M(t) 估 1。 使 用 前 一 个 性 质 和 表 4.3 中 的 平移 性 质 ， 证 明 连 
SERR f(t) = cos(2nnt) 的 傅 里 叶 变 换 是 F(u) = (1/2)[5(u+n)+d(u—n)], FEF nE 
4.4 考虑 连续 函数 S(t) =cos(2nnt) 。 
* (a) f(D) 的 周期 是 什么 ? 
& (b) f(D) 的 频率 是 什么 ? 
SORE LIT ABH F(u) 是 实 的 (见习 题 4.3) ， 因 为 取样 数据 的 傅 里 叶 变 换 由 (jw) 的 周期 副本 组 成 ， 
取样 数据 的 传 里 叶 变换 到 (0) 也 将 是 实 的 。 画 出 一 个 类 似 于 图 4.6 的 图 表 ， 并 根据 所 绘图 表 (假定 取 
样 开始 于 1=0) 回答 下 面 的 问题 。 
x (c) 如 果 /OOD) 以 高 于 奈奈 斯 特 率 的 取样 率 来 取样 ， 取 样 函 数 将 是 什么 ?取样 后 的 函数 及 其 傅 里 叶 变 
换 在 图 中 看 上 去 是 什么 样子 ? 
(d) 如 果 f(D 以 低 于 奈 硅 斯 特 率 的 取样 率 取样 ， 那么 取样 后 的 函数 通常 看 上 去 像 什么 ? 
(c) 如 果 /(D) 以 奈 奎 斯 特 率 取样 ， 且 在 != 0, AT, 2A7 … 处 取样 ， 取 样 后 的 函数 看 上 去 像 什么 ? 
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如 式 (4.2-21) 和 式 (4.2-22) 给 出 的 那样 ， 证 明 连 续 函数 的 一 维 卷 积 定理 的 正确 性 。 

完成 由 式 (4.3-11) 和 式 (4.3-12) 给 出 的 步骤 。 

如 下 图 所 示 , 一 个 “帐篷 形 ”函数 ( 左 侧 ) 的 傅 里 叶 变换 是 一 个 平方 正弦 函数 ( 右 侧 ) 。 提 出 一 个 参量 
来 表明 一 个 “帐篷 形 ”函数 的 传 里 叶 变 换 可 以 由 一 个 盒 状 函数 的 傅 里 叶 变换 得 到 。 (提示 : “帐篷 
形 ”函数 本 身 可 以 由 两 个 相等 的 盒 状 函数 进行 卷 积 操 作 生 成 。) 


Rs 


(a) 证 明 式 (4.4-4) 和 式 (4.4-5) 组 成 傅 里 叶 变换 对 。 
(b) 对 式 (4.4-6) 和 式 (4.4-7) 重复 (a) 。 在 该 习题 的 两 部 分 中 ， 需 要 用 到 如 下 的 指数 正 交 性 质 : 
{a i r=u 

0, 其 他 


S j2nrx/M „-j2rux/M 
2° e = 
证 明 式 (4.4-8) 和 式 (4.4-9) 的 正确 性 。 
证 明 一 个 变量 的 离散 卷 积 定理 的 正确 性 [ 见 式 (4.2-21) 、 式 (4.2-22) 和 式 (4.2-10) ] 。 证 明 时 需要 用 
到 平移 性 质 Qe e F(u 一 uo) MEFE f(x- x) Fuj P 。 
写 出 二 维 连续 卷 积 的 表达 式 。 
考虑 一 幅 棋 盘 图 像 ， 其 中 每 个 方 格 的 大 小 为 0.5 mm x 0.5 mm. 假定 图 像 在 两 个 坐标 方向 上 无 限 扩 
展 ， 为 避免 混淆 ， 问 最 小 取样 率 是 多 少 ( 样 本数/mm) ? 
由 4.5.4 节 中 的 讨论 可 知 ,， 收 缩 图 像 会 导致 混淆 现象 。 放 大 图 像 也 会 导致 混淆 现象 四? 请 
解释 。 
证 明 一 维 连续 和 离散 传 里 叶 变 换 都 是 线性 操作 ( 见 2.6.2 节 关 于 线性 的 定义 ) 。 
假定 读者 有 一 个 用 于 计算 二 维 DFT 对 的 “已 封装 ”程序 ,但 不 知道 1/MN 项 是 包含 在 两 个 公式 中 
的 一 个 公式 中 ,还 是 分 成 两 个 常数 1/VMN 放 在 正 变换 和 反 变 换 前 面 。 如 果 程 序 文档 中 没有 这 种 信 
息 ， 请 问 如 何 才能 找到 包含 该 项 (或 这 些 项 ) 的 位 置 。 
证 明 连 续 和 离散 二 维 傅 里 叶 变 换 都 是 平移 和 旋转 不 变 的 。 
由 习题 4.3 可 以 推出 1 Slv) 和 565(t,z) <1. 使 用 前 一 个 性 质 和 表 4.3 中 的 平移 性 质 ， 证 明 连 续 
函数 f(1,z) = 4cos(2rnt+ 2rvz) 的 傅 里 时 变换 是 


FW) = [p+ tv + ¥9) +51 v= ¥9)] 
证 明 高 散 函数 f(x,y)=1 的 DFT 是 


3{l} = 6(u,v)= | a = 


证 明 离散 函数 f (x, y) = cos(2nu,x + 2rvy) 的 DFT 是 


F(u,v)= Re + Muy, v + Nvy) + 6(u— Muy, v— Nv)] 


下 列 问题 与 表 4.1 中 的 性 质 有 关 。 


* (a) 证 明 性 质 1 的 正确 性 。 


* 


(b) 证 明 性 质 3 的 正确 性 。 
(c) 证 明 性 质 6 的 正确 性 。 
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* (d) 证 明 性 质 7 的 正确 性 。 
(e) 证 明 性 质 9 的 正确 性 。 
(A 证 明 性 质 10 的 正确 性 。 
* (g) 证 明 性 质 11 的 正确 性 。 
(h) 证 明 性 质 12 的 正确 性 。 
(i) 证 明 性 质 13 的 正确 性 。 
*4.21 4.6.6 节 中 在 讨论 频率 域 滤波 时 需要 对 图 像 进行 填充 。 在 该 节 中 给 出 的 图 像 填 充 方 法 是 ， 在 图 像 中 
行 和 列 的 未 尾 填充 0 值 ( 见 上 面 的 左 图 ) 。 如 果 我 们 把 图 像 放 在 中 心 , 四 周 填充 0 值 ( 见 上 面 的 右 图 ) 
而 不 改变 所 用 0 值 的 总 数 ， 会 有 区 别 吗 ? 试 解释 原因 。 
太 4.22 ”同一 幅 图 像 的 两 个 傅 里 叶 频 谱 如 右 图 所 示 。 左 边 的 频谱 对 应 于 
原 图 像 ， 右 边 的 频谱 图 像 是 使 用 0 值 填充 后 得 到 的 。 解 释 右 图 
所 示 的 谱 沿 垂直 轴 和 水 平 轴 方 向 的 信和 号 强度 明显 增加 的 原因 。 
4.23 ”由 表 4.2 可 知 DFT 的 直流 项 F(0,0) 与 其 对 应 的 空间 图 像 的 平均 值 
成 正比 。 假 定 图 像 尺 寸 是 M x No 假如 对 图 像 进 行 零 填充 后 ,图 
像 的 尺寸 为 PxOQ， 其 中 P 和 0 分 别 由 式 (4.6-31) 和 式 (4.6-32) 给 
出 。 令 ,(0,0) 代表 填充 后 的 函数 的 DFT 的 直流 项 。 
* (a) 原 图 像 平 均值 和 填充 后 图 像 平均 值 的 比值 是 多 少 ? 
(b) F,,(0,0) = F(0,0) 吗 ? 假设 从 数学 角度 回答 。 
4.24 证 明 表 4.2 中 的 周期 性 质 (性质 8) 。 
4.25 ”下 列 问题 与 表 4.3 中 的 性 质 有 关 。 
友 (a) 证 明 一 维 情况 下 离散 卷 积 定理 (性 质 8) 的 正确 性 。 
(b) 对 于 二 维 情况 ， 重 复 (a) 。 
(c) 证 明 性 质 9 的 正确 性 。 
(d) 证 明 性 质 13 的 正确 性 。 
(注意 : 习题 4.18、 习 题 4.19 和 习题 4.31 也 与 表 4.3 有 关 。) 
4.26 (a) 证 明 连 续 变 量 上 和 = 的 连续 函数 ,jz 习 的 拉 普 拉 斯 变换 满足 下 列传 里 叶 变换 对 [ 拉 普 拉 斯 变换 的 
定义 见 式 (3.6-3) ] : 








V’ f(t.z) <> 4r (g? + v’ )F (u,v) 


[ 提示: 研究 表 4.3 中 的 性 质 12 并 参阅 习题 4.25 (d) 。] 
* (b) 前 面 闭合 形式 的 表达 式 仅 适 用 于 连续 变量 。 然 而 ,使 用 Mx 滤波 器 


H(u,v)=-4n(u +v*) 


它 可 能 是 在 离散 频率 域 实现 拉 普 拉 斯 的 基础 ，u=0, 1,2,…,M 一 1，v=0, 1,2,…,N 一 1。 解 释 
你 怎样 实现 这 个 滤波 器 。 

(c) 如 你 在 例 4. 20 中 看 到 的 那样 ， 频 率 域 的 拉 普 拉 斯 结果 类 似 于 使 用 中 心 系数 为 -8 的 空间 模板 
的 结果 。 请 说 明 频 率 域 拉 普 拉 斯 的 结果 与 使 用 中 心 系数 为 -4 的 空间 模板 的 结果 不 同 的 原因 。 
见 3. 6. 2 节 关 于 空间 域 的 拉 普 拉 斯 算 子 。 

*4.27 考虑 大 小 为 5x5 的 空间 模板 ， 它 平均 与 点 (x, 力 最 靠近 的 12 个 邻 点 ， 但 平均 中 排除 该 点 本 身 。 
(a) 在 频率 域 找 出 与 其 等 价 的 滤波 器 H(u, v)。 
(b) 证 明 你 的 结果 是 一 个 低 通 滤波 器 。 
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基于 式 (3.6-4) ， 近 似 二 维 离散 微分 的 一 种 方法 是 计算 fc+1 访 +G -1, y)-2f@, WAS E y + 1) + 
f(x,y 一 1) 的 差 。 

(a) 在 频率 域 找 出 与 其 等 价 的 滤波 器 Hu, v)。 

(b) 证 明 你 的 结果 是 一 个 高 通 滤波 器 。 

找 出 一 个 等 价 的 滤波 器 Hw,v)， 它 在 频率 域 实现 使 用 图 3.37 (a) 中 的 拉 普 拉 斯 模板 执行 的 空间 操作 
你 能 想 出 一 种 使 用 傅 里 叶 变 换 计算 (或 分 部 计算 ) 用 于 图 像 差 分 的 梯度 幅度 [ 见 式 (3.6-11) ] 的 
方法 吗 ? 如果 你 的 回答 是 可 以 ， 那么 请 给 出 一 种 方法 去 实现 它 。 如 果 你 的 回答 是 不 可 以 ,请 解 
释 原因 。 

在 连续 频率 域 中 ， 一 个 连续 高 斯 低 通 滤波 器 有 如 下 传递 函数 : 


H(p y= te ™) 
证 明 相 应 的 空间 域 滤波 器 是 


A(t, z) a ne? t +z") 
如 式 (4.9-1) 说 明 的 那样 ， 从 低 通 滤波 器 的 传递 函数 得 到 高 通 滤波 器 的 传递 函数 Ap 是 可 能 的 : 
Hyp =1—Hyp 


使 用 习题 4.31 中 给 出 的 信息 ， 回 答 空间 域 高 斯 高 通 滤波 

器 是 什么 形式 。 

考虑 右 侧 所 示 的 图 像 。 右 图 是 通过 如 下 步 又 得 到 的 : (a) 

FAY? RUA; (b) 计算 其 DFT; (c) 取 该 变换 的 复 

Hi; (d) 计算 反 DET; (e) 用 CT? 乘 以 结果 的 实 部 。( 从 

数学 上 ) 解释 为 什么 右 图 会 出 现 该 现象 。 

图 4.41 (b) 的 水 平 轴 上 近似 周期 性 的 亮点 的 来 源 是 什么 ? 

图 4.53 中 的 每 个 滤波 器 在 其 中 心 处 都 有 一 个 很 强 的 尖 刺 ， 解 释 这 些 尖 刺 的 来 源 。 

考虑 下 面 所 示 的 图 像 。 右 图 是 对 左 图 用 高 斯 低 通 滤波 器 进行 低 通 滤波 ， 然 后 用 高 斯 高 通 滤波 器 对 

结果 再 进行 高 通 滤波 得 到 的 。 图 像 的 大 小 为 420x344， 两 个 滤波 器 均 使 用 了 Do=25。 

(a) 解释 右 图 中 戒指 的 中 心 部 分 明亮 且 实心 的 原因 , 考虑 
滤波 后 图 像 的 支配 特性 是 物体 (如 手指 、 腕 骨 ) 外 边界 
上 的 边缘 及 这 些 边缘 之 间 的 暗 区 域 。 换 句 话 说 ， 你 
并 不 希望 高 通 滤波 器 将 戒指 内 部 的 恒定 区 域 泻 染 为 
暗色 ， 因 为 高 通 滤波 消除 了 直流 项 。 

(b) 如 果 颠 倒 滤波 处 理 的 顺序 ， 你 认为 结果 会 有 区 别 吗 ? 

给 出 一 幅 大 小 为 M x N 的 图 像 ， 要 求 做 一 个 实验 , 实验。 

使 用 截止 频率 为 Do 的 高 斯 低 通 滤波 器 重复 对 该 图 像 进行 《 原 图 像 由 审 睦 根 大 学 医学 院 解剖 

低 通 滤波 。 可 以 忽略 计算 上 的 伟人 误差 。 令 cm 是 实验 所 。 ”学 分 部 的 Thomas R. Gest 博士 提供 

用 机 器 可 表示 的 最 小 正 数 。 

(a) 令 天 表示 该 滤波 器 使 用 的 次 数 。 在 进行 实验 前 ， 你 能 预测 K 为 足够 大 的 值 时 的 结果 (图像 ) 将 是 
什么 吗 ? 如 果 能 ， 结 果 是 什么 ? 

(b) 推导 保证 预测 结果 的 最 小 及 值 的 表达 式 。 

考虑 下 面 所 示 的 图 像 序列 。 最 左 侧 的 图 像 是 商用 印 制 电路 板 的 X 射线 图 像 的 一 部 分 。 该 图 像 右 侧 

的 图 像 分 别 是 使 用 一 个 Du=30 的 高 斯 高 通 滤波 器 进行 1 次 、10 次 和 100 次 滤波 后 的 结果 。 图 像 的 











4.39 


4.40 


* 4,41 
4.42 


4.43 
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大 小 为 330 x 334 像素 ， 每 个 像素 由 8 比特 灰 度 表 示 。 为 便于 显示 ， 图 像 已 进行 了 缩放 ， 但 这 对 本 

习题 没有 影响 。 

(a) 从 这 几 幅 图 像 可 以 看 出 , 经 过 有 限 次 数 的 滤波 后 , 图 像 将 不 再 发 生变 化 。 请 说 明 实际 是 否 如 此 。 
可 以 忽略 计算 舍 人 误差 。 令 cnin 表示 完 成 此 实验 的 机 器 可 表示 的 最 小 正 数 。 

(b) 如 果 在 (a) 中 确定 有 限 次 迭代 后 变化 将 停止 ， 求 最 小 的 迭代 次 数 。 








( 原 图 像 由 Lixi 公司 的 Joseph E. Pascente 先生 提供 ) 


如 图 4.59 中 说 明 的 那样 ， 将 高 频 强 调和 直方 图 均衡 相 结合 是 实现 边缘 锐 化 和 对 比 度 增强 的 有 效 方法 。 
(a) 说 明 这 种 结合 方法 是 否 与 先 用 哪 种 处 理 有 关 。 

(b) 如 果 与 应 用 顺序 有 关 ， 请 给 出 先 采用 某 种 方法 的 理由 。 

使 用 一 个 布 特 沃 斯 高 通 滤波 器 构建 一 个 同 态 滤波 器 ， 该 滤波 器 的 形状 与 图 4.6 中 的 滤波 器 形状 相 
证 明 式 (4.11-16) 和 式 (4.11-17) 的 正确 性 。 GRAS: 使 用 归纳 法 证 明 。) 

假设 有 一 组 图 像 , 这 组 图 像 是 由 对 恒星 事件 分 析 的 实验 生成 的 。 每 幅 图 像 都 包含 一 组 明亮 且 分 散 的 
点 , 这 些 点 对 应 于 广 闪 宇宙 空间 中 的 星星 , 问题 是 这 些 星星 因为 大 气 折射 导致 的 重合 照射 几乎 不 
可 见 。 如 果 这 些 图 像 使 用 一 组 冲 激 建 模 为 一 个 恒定 照射 成 分 的 乘积 ， 试 提出 一 个 增强 过 程 ， 它 以 
设计 为 显示 星星 自身 的 图 像 成 分 的 同 态 滤波 为 基础 。 

一 种 成 熟 的 医学 技术 被 用 于 检测 电子 显微镜 生成 的 某 类 图 像 。 为 简化 检测 任务 , 技术 人 员 决定 采用 
数字 图 像 增强 技术 ， 并 在 处 理 结束 后 ， 检 查 了 一 组 具有 代表 性 的 图 像 ， 发 现 了 如 下 问题 : (1) 明亮 
且 孤 立 的 点 是 不 感 兴趣 的 点 ; (2) 清晰 度 不 够 ; (3) 一些 图 像 的 对 比 度 不 够 ; (4) 平均 灰 度 值 已 被 改 
变 ， 而 正确 地 执行 某 种 灰 度 度量 的 这 个 值 应 是 Vo 技术 人 员 想 要 纠正 这 些 问 题 ， 然 后 将 五 和 五 波段 
之 间 的 所 有 灰 度 显示 为 白色 ， 同 时 保持 其 余 灰 度 的 正常 色调 。 请 为 技术 人 员 提 出 达到 期 望 目的 的 处 
理 步 又 。 可 以 使 用 第 3 章 和 第 4 章 的 技术 。 










‘See are not by themselves what we see. It remains 
own to us what the objects may be by themselves and 


Immanuel Kant 


如 图 像 增 强 那样 ， 图 像 复原 技术 的 主要 目的 是 以 预先 确定 的 目标 来 改善 图 像 。 尽 管 两 者 的 覆盖 领 
域 有 重 倒 之 处 ,但 图 像 增 强 主要 是 一 个 主观 过 程 ， 而 图 像 复 原 大 部 分 是 一 个 客观 过 程 。 图 像 复原 试图 
利用 退化 现象 的 某 种 先 验 知识 来 复原 被 退化 的 图 像 。 因 而 ,复原 技术 是 面向 退化 模型 的 ， 并且 采用 相 
反 的 过 程 进行 处 理 ， 以 便 恢复 出 原 图 像 。 

这 种 方法 通常 会 涉及 设立 一 个 最 佳 准则 来 产生 期 望 结果 的 最 佳 估计 。 相 比 之 下 ， 图 像 增 强 技术 基 
本 上 是 一 个 探索 性 过 程 ， 即 根据 人 类 视觉 系统 的 生理 特点 来 设计 改善 图 像 的 方法 。 例 如 ， 对 比 度 拉 伸 
被 认为 是 一 种 增强 技术 ， 因 为 它 主要 为 观看 者 提供 能 接受 的 图 像 ， 而 通过 去 模糊 函数 去 除 图 像 模糊 则 
被 认为 是 一 种 图 像 复原 技术 。 

本 章 中 给 出 的 素材 严格 地 说 只 是 介绍 性 的 。 我 们 仅 从 给 出 的 一 幅 退 化 数字 图 像 的 特点 来 考虑 复原 
问题 ， 因 此 对 传感器 、 数 字 化 转换 器 和 显示 退化 等 主题 考虑 得 较 少 。 尽 管 这 些 主题 在 图 像 复 原 应 用 的 
整个 处 理 中 非常 重要 ， 但 它们 超出 了 本 章 所 要 讨论 的 范围 。 

如 第 3 章 和 第 4 章 中 讨论 的 那样 ， 有 些 空间 域 复原 技术 已 得 到 了 很 好 的 前 述 ， 而 另 一 些 复原 技术 
则 更 适用 于 频率 域 。 例 如 ， 当 退化 仅 是 加 性 噪声 时 ， 空 间 处 理 就 非常 适用 。 另 一 方面 ， 图 像 模 糊 这 样 
的 退化 在 空间 域 使 用 较 小 的 滤波 模板 处 理 时 ， 会 很 困难 。 在 这 种 情况 下 ， 可 以 选择 基于 不 同 优化 准则 
的 频率 域 滤波 。 这 些 滤波 器 同样 也 考虑 到 了 噪声 的 存在 。 如 第 4 章 中 所 讲 的 那样 ， 频 率 域 中 用 来 解决 
给 定 应 用 的 复原 滤波 器 通常 是 生成 一 个 数字 滤波 器 的 基础 ， 数 字 滤 波 器 的 程序 操作 更 适合 于 用 硬件 或 
固件 来 实现 。 

5.1 节 介 绍 图 像 退化 /复原 过 程 的 一 个 线性 模型 。5.2 节 处 理 实践 中 经 常 遇 到 的 各 种 噪声 模型 。5.3 节 
阐述 降低 图 像 噪声 的 几 种 空间 滤波 技术 ， 即 通常 称 为 图 像 去 嗓 的 处 理 。5.4 节 致 力 于 使 用 频率 域 降 噪 的 技 
术 。5.5 节 介 绍 图 像 退化 的 线性 、 位 置 不 变 模 型 ，5.6 节 介绍 估计 退化 函数 的 方法 。5.7 节 至 5.10 TARE 
本 的 图 像 复原 方法 。 本 章 最 后 ( 见 5.11 节 ) 介 绍 由 投影 来 重建 图 像 。 这 一 概念 的 主要 应 用 是 计算 断层 (CT) ， 
即 图 像 处 理 在 健康 领域 最 为 重要 的 一 种 商业 应 用 。 
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5.1 图 像 退化 /复原 过 程 的 模型 


如 图 5.1 所 示 ， 在 本 章 中 ,退化 过 程 被 建 模 为 一 个 退化 函数 和 一 个 加 性 噪声 项 ， 对 一 幅 输 入 图 像 
S y) 进行 处 理 ， 产 生 一 幅 退 化 后 的 图 像 g(x, y)。 给 定 gGz 力 和 关于 退化 函数 五 的 一 些 知识 以 及 关于 
加 性 噪声 项 7 (x, y) 的 一 些 知识 后 ,图 像 复原 的 目的 就 是 获得 原始 图 像 的 一 个 估计 f(x,y) 。 通 常 ， 我们 
希望 这 一 估计 尽 可 能 地 接近 原始 输入 图 像 ， 并 且 万 和 wy 的 信息 知道 得 越 多 ， 所 得 到 的 f(x, y) 就 会 越 接 
近 f(x,y)。 在 本 章 中 使 用 的 大 部 分 复原 方法 都 是 以 不 同类 型 的 图 像 复 原 滤波 器 为 基础 的 。 

如 5.5 节 所 示 ， 如 果 五 是 一 个 线性 的 、 位 置 不 变 的 过 程 ， 那么 空间 域 中 的 退化 图 像 可 由 下 式 给 出 : 


g(x,y)=h(x,y) f(x,y) +n, y) (5.1-1) 
式 中 ,h(x, 力 是 退化 函数 的 空间 表示 ; 与 第 4 章 相 同 , 符号 “ 塘 ” 表 示 空 间 卷 积 。 由 4.6.6 节 的 讨论 可 知 ， 
空间 域 中 的 卷 积 等 同 于 频率 域 中 的 乘积 ， 因 此 可 以 把 式 (5.1-1) 中 的 模型 写成 等 价 的 频率 域 表示 : 

G(u,v) = H(u,v)F (u,v) + N (u,v) (5.1-2) 
其 中 的 大 写字 母 项 是 式 (5.1-1) 中 相应 项 的 傅 里 叶 变换 。 这 两 个 公式 是 本 章 中 大 部 分 复原 内 容 的 基础 。 


g(x, y) 
H 


噪声 
| n(x, y) | 


退化 复原 
51 图 像 退 化 /复原 过 程 的 模型 


在 接 下 来 的 三 节 中 ， 我们 假设 肪 是 一 个 同一 性 算 子 ， 并 且 只 处 理由 噪声 引起 的 退化 。 从 5.6 节 开 
te, 我们 考虑 若干 重要 的 图 像 退 化 函数 ， 并 考虑 几 个 及 和 7 同时 存在 的 图 像 复 原 方法 。 


5.2 ”噪声 模型 


数字 图 像 中 ， 噪 声 主 要 来 源 于 图 像 的 获取 和 /或 传输 过 程 。 成 像 传感器 的 性 能 受 各 种 因素 的 影响 ， 
如 图 像 获 取 过 程 中 的 环境 条 件 和 传 感 元 器 件 自身 的 质量 。 例 如 ， 在 使 用 CCD 摄像 机 获取 图 像 时 ， 光 
照 水 平和 传感器 温度 是 影响 结果 图 像 中 噪声 数量 的 主要 因素 。 图 像 在 传输 中 被 污染 主要 是 由 于 传输 信 
道中 的 干扰 。 例 如 ， 使 用 无 线 网 络 传输 的 图 像 可 能 会 因为 光照 或 其 他 大 气 因素 而 污染 。 


5.2.1 噪声 的 空间 和 频率 特性 


与 我 们 的 讨论 相关 的 是 定义 噪声 空间 特性 的 参数 ， 以 及 噪声 是 否 与 图 像 相 关 。 频 率 特性 是 指 傅 里 
叶 域 中 噪声 的 频率 内 容 ( 即 相对 于 电磁 波谱 的 频率 ) 。 例 如 ， 当 噪声 的 传 里 叶 谱 是 常量 时 ， 噪 声 通常 称 
为 白 噪声 。 这 个 术语 是 从 白光 的 物理 特性 派生 出 来 的 ， 它 以 相等 的 比例 包含 可 见 光 谱 中 的 几乎 所 有 频 
率 。 从 第 4 章 的 讨论 中 不 难看 出 ， 以 相同 比例 包含 所 有 频率 的 函数 的 传 里 叶 谱 是 一 个 常量 。 

除了 空间 周期 噪声 ( 见 5.2.3 节 ) 之 外 ， 在 本 章 中 我 们 假设 噪声 与 空间 坐标 无 关 ， 并 且 噪 声 与 图 像 
本 身 不 相关 ( 即 像素 值 与 噪声 成 分 的 值 之 间 不 相关 ) 。 虽 然 这 些 假设 至 少 在 某 些 应 用 中 (例如 X 射线 
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和 核 医学 成 像 的 有 限量 子 成 像 就 是 一 个 很 好 的 例子 ) 是 无 效 的 ,但 处 理 空 间 相 关 和 相关 性 噪声 的 复杂 性 
超出 了 我 们 讨论 的 范围 。 

5.2.2 “一些 重要 的 噪声 概率 密度 函数 

基于 前 一 节 的 假设 ， 我 们 关心 的 空间 噪声 描述 子 就 是 图 5.1 中 模型 的 噪声 成 分 中 灰 度 值 的 统计 特 


性 。 可 以 认为 它们 是 由 概率 密度 函数 (PDF) 表征 的 随机 变量 。 下 面 是 | 8, 关于 概率 论 的 简要 回顾 ,请 碍 
在 图 像 处 理应 用 中 最 常见 的 PDF。 阅 本 书 的 网 站 。 


高 斯 噪声 

在 空间 域 和 频率 域 中 ,- 由 于 高 斯 噪声 在 数学 上 的 易 处 理性 ， 故 实践 中 常用 这 种 噪声 (也 称 为 正 态 
噪声 ) 模 型 。 事实 上 , 这 种 易 处 理性 非常 方便 ,以 至 于 高 斯 模型 常常 应 用 于 在 一 定 程度 上 导致 最 好 结果 
的 场合 。 

高 斯 随机 变量 z 的 PDF 由 下 式 给 出 : 





p(z)= = @-(2-2) 120 (5.2-1) 
TO 


式 中 ，z 表示 灰 度 值 ，z 表示 z 的 均 平 均 ) OH, CAR z 的 标准 差 。 标 准 差 的 平方 只 称 为 z 的 方差 。 高 斯 
函数 的 曲线 如 图 5.2 (a) 所 示 。 当 z 服从 式 (5.2-1) 的 分 布 时 ， 其 值 有 大 约 70% 落 在 范围 [(z -0, (7+ OA, 
有 大 约 95% 落 在 范围 [(z -20),(z +2 内 。 


abs p(z) p(z) 
def 
wee S| E = se 2 | 
TA 0.607 lA 
瑞 利 
0.607 | _ 
2na 


Z-G72 Z+¢ z 4 b p 
a+ 7 











Zz a b z 


图 5.2 一些 重要 的 概率 密度 函数 


瑞 利 噪声 
瑞 利 噪声 的 PDF 由 下 式 给 出 : 


D 在 本 节 中 我 们 使 用 而 非 m 来 表示 均值 的 原因 是 ， 避 免 我 们 在 后 面 使 用 m 和 来 表示 邻 域 大 小 时 引起 混淆 。 
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p(z)= 5 aes, (5.2-2) 
0, z<a 
概率 密度 的 均值 和 方差 由 
z=at+Vnb/4 (5.2-3) 
和 
ae we (5.2-4) 


给 出 。 图 5.2 (b) 显示 了 瑞 利 密度 的 曲线 。 注意, 距 原 点 的 位 移 和 密度 的 基本 形状 向 右 变 形 了 这 一 事实 。 
瑞 利 密度 对 于 近似 牌 斜 的 直方 图 十 分 适用 。 


爱尔兰 ( 伽 马 ) 噪声 
爱尔兰 噪声 的 PDF 由 下 式 给 出 : 
az? z 
ee Ne rnt ey (5.2-5) 
0, z<a 
sth, Bta>0, b 为 正 整 数 ; 并且“!” 表 示 阶 乘 。 其 概率 密度 的 均值 和 方差 由 
Fie (5.2-6) 
a 
和 
o = zi (5.2-7) 
a 


给 出 。 图 5.2(c) ER Til Sosa ABE HA, SPSL S.2-5) AMZ AD BA, (AU, AR 
在 分 母 为 伽 马 函数 (b) 时 才 是 正确 的 。 当 分 母 如 表达 式 所 示 时 ， 该 密度 称 为 爱尔兰 密度 更 合适 。 


指数 噪声 
指数 噪声 的 PDF 由 下 式 给 出 : 
p(z)= I af! (5.2-8) 
式 中 ，a > 0。 该 概率 密度 函数 的 均值 和 方差 是 
zal (5.2-9) 
a 
Ail 
a = (5.2-10) 
注意 ,这 个 PDF Æ b=1 时 爱尔兰 PDF 的 特殊 情况 图 5.2(d) 显示 了 该 密度 函数 的 曲线 。 
均匀 噪声 
均匀 噪声 的 PDF 由 下 式 给 出 : 
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Wd Or? (52-11) 
0 其 他 
该 密度 函数 的 均值 由 下 式 给 出 : 
= (5.2-12) 
它 的 方差 由 下 式 给 出 : 
b=). (5.2-13) 
12 
5.2 (e) 显示 了 均匀 密度 的 曲线 。 
脉冲 (椒盐 ) 噪声 
( 双 极 ) 脉冲 噪声 的 PDF 由 下 式 给 出 : 
B z=a 
P(z)=4%,, z=b (5.2-14) 
1-P,-P, 其 他 


WR b>a， 则 灰 度 级 5 在 图 像 中 将 显示 为 一 个 亮点 ; MZ, WER a 在 图 像 中 将 显示 为 一 个 瞳 点 。 郑 
PP 或 PP 为 零 ， 则 脉冲 噪声 称 为 单 极 脉冲 。 如 果 P, A Ps 两 者 均 不 可 能 为 零 ， 尤 其 是 它们 近似 相等 时 ， 
则 脉冲 噪声 值 将 类 似 于 在 图 像 上 随机 分 布 的 胡椒 和 盐 粉 微粒 。 由 于 这 个 原因 ， 双 极 脉冲 噪声 也 称 为 椒 
盐 噪 声 。 这 种 类 型 的 噪声 也 可 以 使 用 散 粕 噪声 和 尖峰 骂 声 来 称呼 。 在 下 面 的 讨论 中 ,我 们 将 交 蔡 使 用 
脉冲 噪声 和 椒盐 噪声 这 两 个 术语 。 

噪声 脉冲 可 以 为 正 也 可 以 为 负 。 标定 通常 是 图 像 数 字 化 处 理 的 一 部 分 。 因 为 ， 与 图 像 信号 的 强度 
相 比 ， 脉 冲 污染 通常 较 大 ， 所 以 在 一 幅 图 像 中 脉冲 噪声 通常 被 数字 化 为 最 大 值 ( 纯 黑 或 纯 白 ) 。 这 样 ， 
通常 假设 a 和 4b 是 饱和 值 ， 从 某 种 意义 上 看 ， 在 数字 化 图 像 中 ， 它 们 等 于 所 允许 的 最 大 值 和 最 小 值 。 
由 于 这 一 结果 ， 负 脉冲 以 一 个 黑 点 (胡椒 点 ) 出 现在 图 像 中 。 由 于 相同 的 原因 ， 正 脉冲 以 白 点 ( 盐 粒 点 ) 
出 现在 图 像 中 。 对 于 一 幅 8 比特 图 像 ， 这 通常 意味 着 a=0( 黑 ) 和 4b=255( 白 )。 图 5.2 (显示 了 脉冲 品 
声 的 概率 密度 函数 (PDF) 。 

前 述 的 一 组 PDF 为 在 实践 中 建立 宽带 噪声 污染 状态 的 模型 提供 了 有 用 的 工具 。 例如 , 在 一 幅 图 像 
中 ,高 斯 噪声 源 于 诸如 电子 电路 噪声 以 及 由 低 照明 度 和 /或 高 温带 来 的 传感器 噪声 。 瑞 利 密度 有 助 于 在 
深度 成 像 中 表征 噪声 现象 。 指 数 密度 和 伽 马 密度 在 激光 成 像 中 很 有 用 。 如 前 段 提 及 的 那样 ， 脉 冲 噪声 
在 快速 过 渡 的 情况 下 产生 , 如 在 成 像 期 间 发 生 的 错误 开关 操作 。 均匀 密度 可 能 是 实践 中 描述 得 最 少 的 ， 
然而 ,均匀 密度 作为 仿真 中 使 用 的 许多 随机 数 生成 器 的 基础 是 非常 有 用 的 ( 见 Peebles[1993] 和 Gonzalez, 
Woods and Eddins[2004]) 。 


例 5.1 噪声 图 像 及 其 直方 图 。 
图 5.3 品 示 了 一 析 非 党 适合 表达 风 出 计 论 的 电 模 型 的 出 计 图 
Ro eda pe 因为 它 由 简单 的 恒定 的 区 域 组 成 ， 县 





图 5.3 用 于 说 明显 示 在 图 5.2 中 的 
噪声 PDF 特性 的 测试 图 案 





第 5 章 图像 复 原 与 重建 201 


噪声 的 参数 ， 以 便 对 应 于 测试 图 案 中 3 种 灰 度 级 的 直方 图 会 开始 合并 。 这 会 使 得 噪声 十 分 明显 ,但 不 会 庶 
项 底层 图 像 的 基本 结构 。 

比较 图 5.4 中 的 直方 图 和 图 5.2 中 的 概率 密度 函数 ， 可 以 看 到 很 接近 的 对 应 关系 。 对 于 椒盐 噪声 ， 示 例 的 
直方 图 在 密度 标 度 的 白 端 有 一 个 额外 的 尖峰 ， 因 为 噪声 成 分 为 纯 黑 或 纯 白 ， 且 在 测试 图 案 中 最 亮 的 成 分 ( 圆 ) 是 
亮 灰 度 。 除 了 少许 亮度 不 同 外 ， 在 图 5.4 中 很 难 区 分 出 前 5 幅 图 像 有 什么 明显 不 同 ， 即 使 它们 的 直方 图 有 明显 
的 区 别 。 由 脉冲 噪声 污染 的 图 像 的 椒盐 噪声 ， 是 唯一 -种 引起 退化 的 、 视 觉 上 可 区 分 的 噪声 类 型 。 





椒盐 
图 5.4 对 图 5.3 中 的 图 像 添加 高 斯 、 瑞 利 、 伽 马 、 指 数 、 均 匀 和 椒盐 噪声 后 的 图 像 与 直方 图 





5.2.3 周期 噪声 


图 像 中 的 周期 噪声 是 在 图 像 获 取 期 间 由 电力 或 机 电 干 扰 产 生 的 。 这 是 在 本 章 中 讨论 的 唯一 一 种 空 
间 相 关 品 声 。 如 5.4 节 所 讨论 的 那样 , 周期 噪声 可 通过 频率 域 滤 波 来 显著 地 减少 , 例如 , 考虑 图 5.5 (a) 
中 的 图 像 。 这 幅 图 像 被 不 同 频率 的 (空间 ) 正弦 噪声 严重 干扰 。 一 个 纯正 弦 波 的 傅 里 叶 变 换 是 位 于 正弦 波 
共 斩 频 率 处 的 一 对 共 斩 脉 冲 ”( 见 表 4.3) 。 因 此 ， 如 果 空 间 域 中 正弦 波 的 振幅 足够 强 ， 我 们 在 该 图 像 的 谱 
中 将 看 到 图 像 中 每 个 正弦 波 的 脉冲 对 。 如 图 5.5 (b) 所 示 ， 确 实 如 此 , 由 于 在 这 个 特殊 例子 中 频率 值 是 这 
样 安排 的 ， 所 以 脉冲 以 一 个 近似 的 圆 出 现 。 在 5.4 节 中 我 们 将 进一步 讨论 此 问题 ， 以 及 周期 噪声 的 其 他 
例子 





D 注意 不 要 混 涌 频 率 域 中 的 术语 脉冲 与 脉冲 噪声 中 使 用 的 同一 术语 。 
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sitters ab 
图 5.5 (a) WE; F 弘 噪声 污染 的 图 人 人 b) 谱 (每 对 共 斩 脉 冲 对 应 于 一 个 正 弱 波 ) ( 原 图 像 由 NASA 提供 ) 





5.2.4 ”噪声 参数 的 估计 


周期 噪声 的 参数 通常 是 通过 检测 图 像 的 傅 里 叶 谱 来 估计 的 。 如 前 几 节 提 及 的 那样 ， 周 期 噪声 趋向 
于 产生 频率 尖峰 ， 甚 至 通过 视觉 分 析 也 经 常 可 以 检测 到 这 些 尖 峰 。 另 一 种 方法 是 试图 直接 由 图 像 推 断 
出 噪声 成 分 的 周期 性 ， 但 这 仅 在 非常 简单 的 情况 下 才 是 可 能 的 。 在 噪声 尖峰 格外 明显 或 可 以 使 用 关于 
二 扰 的 频率 成 分 一 般 位 置 的 某 些 知识 时 ， 自 动 分 析 是 可 能 的 。 

噪声 PDF 的 参数 一 般 可 以 从 传感器 的 技术 说 明 中 得 知 , 但 对 于 特殊 的 成 像 装 置 通常 需要 估计 这 些 
参数 。 如 果 成 像 系 统 可 用 , 那么 研究 系统 噪声 特性 的 一 种 简单 方法 是 ,获取 一 组 “平坦 ”环境 的 图 像 ， 
例如 ， 在 光学 传感器 的 情况 下 ， 这 会 如 对 一 个 光照 均匀 的 纯色 灰 度 板 成 像 那样 简单 。 结 果 图 像 是 典型 
的 系统 噪声 的 良好 指示 需 

当 仅 有 通过 传感器 生成 的 图 像 可 用 时 , 通常 可 由 合理 的 恒定 灰 度 值 的 一 小 部 分 来 估计 PDF 的 参 
数 。 例 如 ， 图 5$.6 所 示 的 垂直 条 带 (150x20 像素 ) 是 从 图 $.4 中 所 示 的 高 斯 、 瑞 利和 均匀 图 像 中 截取 的 ， 
所 显示 的 直方 图 是 使 用 这 些小 条 带 的 图 像 数据 计算 出 来 的 。 与 图 5.6 中 的 直方 图 对 应 的 图 5.4 中 的 
直方 图 ， 是 图 5.4(d) 、 图 5.4(e) 和 图 5.4(k) 这 三 组 直方 图 中 间 的 一 组 。 我 们 可 以 看 出 ， 这 些 对 应 
的 直方 图 的 形状 非常 接近 于 图 5.6 中 的 直方 图 形状 。 由 于 缩放 的 原因 ; 它们 的 高 度 不 同 , 但 形状 明 
显 类 似 。 


abc 
图 5.6 使 用 小 条 带 ( 显 示 为 捅 图 ) 从 图 5.4 PHI (a) 高 斯 、(b) 瑞 利 和 (ce) 均匀 噪声 图 像 计 算 的 直方 图 


来 自 图 像 条 带 数据 的 最 简单 的 用 途 是 计算 灰 度 级 的 均值 和 方差 。 考 虑 由 S 表示 的 一 个 条 带 ( 子 图 
像 ) ,并 令 .ps(2) 寺 =0, 12,，… , L-1 表示 5 中 像素 灰 度 的 概率 估计 ( 归 一 化 直方 图 值 ) , 其 中 工 是 整 
个 图 像 中 可 能 的 灰 度 数 ( 例 如 ,对 于 8 比特 图 像 , 工 为 256) 。 如 第 3 章 那样 , 我 们 估计 S 的 均值 和 方 
差 如 下 : 





Sy py) (5.2-15) 


3 o? = Y (z; -下 ?pr(z) (5.2-16) 
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直方 图 的 形状 确定 最 接近 的 PDF 匹配 。 如 果 其 形状 近似 于 高 斯 , 那么 均值 和 方差 正 是 我 们 所 需要 
的 ， 因 为 高 斯 PDF 完全 由 这 两 个 参数 指定 。 对 于 5.2.2 节 讨 论 的 其 他 形状 ， 我们 使 用 均值 和 方差 来 解 
出 参数 a 和 bp。 使 用 不 同 的 方法 来 处 理 脉 冲 噪声 ， 因 为 需要 的 估计 是 黑 、 白 像素 出 现 的 实际 概率 。 获 
得 这 些 估计 值 需 要 黑白 像素 可 见 , 因此 为 了 计算 直方 图 , 图 像 中 需要 有 一 个 相对 恒定 的 中 等 灰 度 区 域 。 
对 应 于 黑 、 白 像素 的 尖峰 的 高 度 是 式 (5.2-14) 中 Ps 和 Ps 的 估计 值 。 


5.3 ”只 存在 噪声 的 复原 一 一 空间 滤波 3 


当 一 幅 图 像 中 唯一 存在 的 退化 是 噪声 时 ， 式 ($.1-1) 和 式 (5.1-2) 变 成 
g(x,y) = f(x,y) +(x, y) (5.3-1) 





和 
G(u,v) = F(u,v)+ N(u,v) (5.3-2) 
噪声 项 是 未 知 的 ， 故 从 g(x, ?或 Gu, v) 中 减 去 它们 不 现实 。 在 周期 噪声 的 情况 下 ， 通 常 可 由 Gu, v) 的 谱 
来 估计 Mu, 人， 正如 5.2.3 节 所 述 。 在 这 种 情况 下 ， 从 Gu, VPE Mu, v) 可 得 到 原 图 像 的 一 个 估计 。 
然而 ， 这 种 类 型 的 知识 通常 只 是 例外 而 不 是 规律 。 
在 仅 存 在 加 性 噪声 的 情况 下 ， 可 以 选择 空间 滤波 方法 。 空 间 滤 波 已 在 第 3 章 中 详细 讨论 过 。 除 了 
执行 一 种 特定 的 滤波 来 计算 特性 外 ， 下 面 实现 的 所 有 滤波 的 机 理 完全 与 3.5 节 和 3.6 节 中 讨论 的 一 样 。 
5.3.1 均值 滤波 器 
本 节 简 要 讨论 3.5 节 中 介绍 过 的 空间 滤波 器 的 降 品 能力， 并 探讨 一 些 其 他 的 滤波 器 ， 这 些 滤波 器 
的 性 能 在 许多 情况 下 要 优 于 3.5 节 中 讨论 的 滤波 器 的 性 能 。 
算术 均值 滤波 器 
这 是 最 简单 的 均值 滤波 器 。 令 Sy 表示 中 心 在 点 (x,y) 处 、 大 小 为 mxn 的 矩形 子 图 像 窗 口 ( 邻 域 ) 
的 一 组 坐标 。 算 术 均 值 滤波 器 在 Su 定义 的 区 域 中 计算 被 污染 图 像 
g(x,y) 的 平均 值 。 在 点 (x,y) 处 复原 图 像 了 的 值 ， 就 是 简单 地 使 用 Su 
定义 的 区 域 中 的 像素 计算 出 的 算术 均值 ， 即 
> 1 
(x,y) =— (s,t) (5.3-3) 
Jean Dat 
这 个 操作 可 以 使 用 大 小 为 m xz 的 一 个 空间 滤波 器 来 实现 ， 滤 波 器 的 所 有 系数 均 为 其 值 的 1/mn。 均 值 
滤波 平滑 一 幅 图 像 中 的 局 部 变化 ， 虽 然 模糊 了 结果 ， 但 降低 了 噪声 。 
几何 均值 滤波 器 
使 用 几何 均值 滤波 器 复原 的 一 幅 图 像 由 如 下 表达 式 给 出 : 
fy) | TI 26s. am (5.3-4) 
(s, DES, 


其 中 , 每 个 复原 的 像素 由 子 图 像 窗 口中 像素 的 乘积 的 1/mn 次 宕 给 出 。 如 例 5.2 ras, SLATES at 
实现 的 平滑 可 与 算术 均值 滤波 器 相 比 ， 但 这 种 处 理 中 丢失 的 图 像 细 节 更 少 。 
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谐 波 均值 滤波 器 
谐 波 均值 滤波 操作 由 如 下 表达 式 给 出 : 
f(x, y= —- 
(s, HES, g(s, t) 
谐 波 均值 滤波 器 对 于 盐 粒 噪声 效果 较 好 ， 但 不 适用 于 胡椒 噪声 。 它 善于 处 理 像 高 斯 噪声 那样 的 其 他 
噪声 。 


逆 谐 波 均值 滤波 器 
逆 谐 波 均值 滤波 器 基于 如 下 表达 式 产生 一 幅 复 原 的 图 像 : 
> s(t 


(s, DES, 


> a(s,0)° 
(s,HeS,, 
其 中 O 称 为 滤波 器 的 阶 数 。 这 种 滤波 器 适合 减少 或 在 实际 中 消除 椒盐 噪声 的 影响 。 当 O 值 为 正 时 , 该 
滤波 器 消除 胡椒 噪声 ; 当 O 值 为 负 时 ， 该 滤波 器 消除 盐 粒 噪声 。 但 它 不 能 同时 消除 这 两 种 噪声 。 注 意 ， 
当 O=0 时 ， 逆 屁 波 均值 滤波 器 简化 为 算术 均值 滤波 器 ; 而 当 O= -1 时 ， 则 为 谐 波 均值 滤波 器 。 


例 5.2 均值 滤波 器 的 说 明 。 

”图 5.7(a) 显示 了 一 块 电路 板 的 8 比特 X 射线 图 像 ， 图 5.7(b) 显示 了 同一 幅 图 像 ， 但 该 图 像 已 被 均值 为 
零 、 方 差 为 400 的 加 性 高 斯 噪声 污染 。 对 于 这 种 类 型 的 图 像 ， 这 是 非常 严重 的 噪声 。 图 5.7(c) 和 图 5.7(d) 
分 别 显示 了 使 用 大 小 为 3 x 3 的 算术 均值 滤波 器 和 同样 大 小 的 几何 均值 滤波 器 滤 除 噪 声 后 的 结果 。 尽管 这 

可 殉 值 滤波 器 并 未 像 算术 均值 滤波 器 那样 使 图 像 变 得 模糊 。 例 如 ， 图 
像 顶 部 的 连接 片 在 图 5:7(d) 中 比 在 图 57(e) 中 更 为 清晰 :图像 的 其 他 部 分 同样 如 此 。 


(5.3-5) 





f(x, y)= (5.3-6) 














OSa f o Da = i aAa 
图 5.7 (a) X 射线 图 像 ; (b) 被 加 性 高 斯 噪声 污染 的 图 像 ，(c) 使 用 大 小 为 3x3 的 
算术 均值 滤波 器 对 图 像 滤波 后 的 结果 ; (d) 使 用 相同 大 小 的 几何 均值 滤波 
器 对 图 像 滤 波 后 的 结果 ( 原 图 像 由 Lixi 公司 的 Joseph E. Pascente 先生 提供 ) 
图 5.8(a) 显示 了 同样 的 电路 图 像 ， 但 被 概率 为 0.1 的 胡椒 噪声 污染 。 类 似 地 , 图 5.8(b) 显示 了 已 被 具有 
相同 概率 的 盐 粒 噪声 污染 了 的 图 像 。 图 5.8(c) 显示 了 使 用 O= 1.5 的 道 谐 波 均值 滤波 器 对 图 5.8(a) 滤波 的 结 
果 。 图 5.8(d) ER TEH Q = -1.5 的 道 谐 波 均值 滤波 器 对 图 5.8 (b) 滤波 后 的 结果 。 两 种 滤波 器 都 有 很 好 的 
去 品 效 果 。 这 种 正 阶 滤波 器 除了 使 得 暗 区 稍微 有 些 淡化 和 模糊 之 外 ,都 使 背景 变 得 更 为 清晰 ; 负 阶 滤波 器 


的 作用 正好 相反 。 
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图 5.8 OWEN 0.1 MANER 污染 的 图 像 (b) 被 相同 概率 的 寺 粒 噪声 污染 的 
图 像 ;(c) 使 用 大 小 为 3x3、 阶 数 为 1.5 的 逆 谐 波 均值 滤波 器 对 图 (a) 滤波 
后 的 结果 ; (EH O = -1.5 的 逆 谐 波 均值 滤波 器 对 图 (b) 滤波 后 的 结果 


总 之 , 算术 均值 滤波 器 和 几何 均值 滤波 器 (尤其 是 后 者 ) 更 适合 于 处 理 高 斯 或 均匀 随机 噪声 。 逆 谐 波 均 
值 滤波 器 更 适合 于 处 理 脉冲 噪声 , 但 它 还 有 一 个 缺点 , 即 必须 知道 噪声 是 暗 噪声 还 是 亮 噪声 ,以 便 为 O 选 
择 的 正确 符号 。 如 果 O 的 符号 选择 错误 ， 则 可 能 会 引起 灾难 性 的 后 果 ， 如 图 5.9 所 示 。 下 面 几 节 讨论 的 一 
些 滤波 器 可 消除 这 种 缺点 。 





图 5.9 在 逆 谐 波 滤波 中 选择 错误 符号 的 结果 :，(a) 使 用 大 小 为 3x3 且 0= -1.5 的 逆 谐 
波 滤波 器 对 图 $.8 (a) 滤波 后 的 结果 ; (b) O = 1.5 时 对 图 5.8(b) 滤波 后 的 结果 


5.3.2， 统 计 排 序 滤波 器 


3.5.2 节 介绍 过 统计 排序 滤波 器 。 我 们 现在 扩充 那 一 节 的 讨论 ， 并 介绍 其 他 一 些 统计 排序 滤波 器 。 
正如 3.5.2 节 所 述 ， 统 计 排序 滤波 器 是 空间 域 滤波 器 ， 空 间 域 滤波 器 的 响应 基于 由 该 滤波 器 包围 的 图 像 
区 域 中 的 像素 值 的 顺序 (排序 ) 。 排 序 结果 决定 滤波 器 的 响应 。 


中 值 滤波 器 
最 著名 的 统计 排序 滤波 器 是 中 值 滤波 器 ， 如 其 名 称 所 示 的 那样 ， 它 使 用 一 个 像素 邻 域 中 的 灰 度 级 
的 中 值 来 替代 该 像素 的 值 ， 即 
fœ y= median {g(s,7)} (5.3-7) 


在 (x, ») 处 的 像素 值 是 计算 的 中 值 。 中 值 滤波 器 的 应 用 非常 普遍 ， 因 为 对 于 某 些 类 型 的 随机 噪声 ， 它 
们 可 提供 良好 的 去 噪 能 力 ， 且 与 相同 尺寸 的 线性 平滑 滤波 器 相 比 ， 引 起 的 模糊 更 少 。 在 存在 单 极 或 
双 极 脉冲 噪声 的 情况 下 ， 中 值 滤波 器 尤其 有 效 。 事 实 上 ， 如 下 面 的 例 5.3 所 示 ， 中 值 滤波 器 对 于 这 种 
噪声 污染 的 图 像 可 得 到 非常 好 的 处 理 效 果 。 这 种 滤波 器 中 值 的 计算 和 实现 已 在 3.5.2 节 中 进行 了 详细 
讨论 。 
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最 大 值 和 最 小 值 滤波 器 

尽管 中 值 滤波 器 是 目前 为 止 图 像 处 理 中 最 常用 的 一 种 统计 排序 滤波 器 ， 但 它 绝 不 是 唯一 的 一 种 。 
中 值 相当 于 顺序 排列 的 数组 中 间 的 那个 数 ， 但 我 们 从 基本 统计 学 可 回 | 关于 数 的 排列 顺序 的 注释 请 参阅 
想到 排列 本 身 还 有 很 多 其 他 的 可 能 性 。 例 如 ,- 可 以 使 用 序列 中 的 最 后 | 1035 节 中 的 第 二 条 注释 。 
一 个 数值 ， 称 为 最 大 值 滤波 器 ， 由 下 式 给 出 : 

fx, y)= max {g(s,0)} (5.3-8) 

这 种 滤波 器 对 于 发 现 图 像 中 的 最 亮点 非常 有 用 。 同 样 ， 因 为 胡椒 噪声 的 值 非常 低 ， 作 为 子 图 像 区 域 Sw 


中 这 种 最 大 值 选择 过 程 的 结果 ， 可 以 用 这 种 滤波 器 降低 它 。 
选择 起 始 值 的 滤波 器 称 为 最 小 值 滤波 器 ， 它 由 下 式 给 出 : 
fœ y)= min {g(s, 9} (5.3-9) 
这 种 滤波 器 对 于 发 现 图 像 中 的 最 暗 点 非常 有 用 。 同 样 ， 作 为 最 小 值 操作 的 结果 ,， 它 可 以 降低 盐 粒 噪声 。 
中 点 滤波 器 


中 点 滤波 器 简单 地 计算 滤波 器 包围 区 域 中 最 大 值 和 最 小 值 之 间 的 中 点 ， 即 


f(x, Dezhe (sD) + min {a(s.9)] (5.3-10) 


5, t)ES y : (5, 1)eSs,, 


注意 ， 这 种 滤波 器 结合 了 统计 排序 和 求 平均 。 它 最 适用 于 处 理 随机 分 布 的 噪声 ， 如 高 斯 噪声 或 均匀 嗓 声 。 
修正 的 阿尔 法 均值 滤波 器 4 
假设 在 邻 域 Ss 内 去 掉 g(s, 最 低 灰 度 值 的 d2 和 最 高 灰 度 什 的 d2。 令 guls, 0 代表 剩 下 的 mn—d 个 
像素 。 由 这 些 剩余 像素 的 平均 值 形成 的 滤波 器 称 为 修正 的 阿尔 法 均值 江波 器 : 


via. 4 

OS) rea p g, (s, t) (5.3-11) 
式 中 ，4 的 取 值 范围 可 为 0 到 mn - 1。 当 4 = 0 时 ， 修 正 的 阿尔 法 均值 滤波 器 退化 为 前 一 节 讨 论 的 算术 
均值 滤波 器 。 如 果 选 择 d= mm 一 1， 则 修正 的 阿尔 法 均值 滤波 器 将 退化 为 中 值 滤波 器 。 当 d 取 其 他 值 时 ， 
修正 的 阿尔 法 均值 滤波 器 在 包括 多 种 噪声 的 情况 下 很 有 用 ,如 混合 有 高 斯 噪声 和 椒盐 噪声 的 情况 。 
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图 5.10 @ 被 概率 为 P,=P,=0.1 AREER INESE OMERIN 3 3x3 NLP ITI 
次 后 的 结果 ; (c) 使 用 该 滤波 器 对 图 (b) 滤波 后 的 结果 ; (d) 使 用 相同 的 滤波 器 处 理 图 (c) 后 的 结果 





图 $.11 (a) 使 用 大 小 为 3x3 的 最 大 值 滤波 器 对 图 5.8 (a) 滤波 后 的 结果 ; 
(b) 使 用 相同 大 小 的 最 小 值 滤波 器 对 图 5.8 (b) 滤波 后 的 结果 


下 面 说 明 修正 的 阿尔 法 均值 滤波 器 。 图 5.12(a) 显示 了 一 幅 被 均值 为 零 、 方 差 为 800 的 加 性 均匀 噪声 污 
染 的 图 像 。 这 是 一 种 高 级 别 的 噪声 污染 , 它 被 P,= P,=0.1 的 椒盐 噪声 肥 加 而 进一步 劣化 ， 如 图 5.12 (b) 所 
示 。 对 这 幅 图 像 中 的 高 级 别 噪声 使 用 更 大 的 滤波 器 是 正确 的 。 图 5.12(c) 到 图 5.12 (1) 依次 显示 了 使 用 大 小 为 
5x5 的 算术 均值 、 几 何 均值 、 中 值 和 d=5 的 修正 的 阿尔 法 均值 滤波 器 处 理 后 的 图 像 。 如 所 预料 的 那样 ， 由 
于 脉冲 噪声 的 存在 ,算术 均值 滤波 器 和 几何 均值 滤波 器 (尤其 是 后 者 ) 并 未 起 到 良好 的 作用 。 中 值 滤波 器 和 
修正 的 阿尔 法 均值 小 波 器 则 要 好 得 多 ， 在 降 品 方 面 修正 的 阿尔 法 均值 滤波 器 的 效果 更 好 一 些 。 例 如 ,注意 
图 像 左上 角 第 4 个 连接 片 在 修正 的 阿尔 法 均值 滤波 器 处 理 后 变 得 稍微 平滑 一 些 。 这 并 不 意外 ， 因 为 对 于 高 
的 d 值 ,修正 的 阿尔 法 均值 滤波 器 接近 于 中 值 滤波 器 的 性 能 ， 但 仍然 保留 了 一 些 平滑 能 力 。 


abe 
Wien 





图 5.12 “(g 被 加 性 均匀 噪声 污染 的 图 像 ; (b) 再 被 加 性 椒盐 噪声 污染 的 图 像 ;， (ce) 使 用 大 小 
为 5x 5 的 算术 均值 滤波 器 对 图 \b) 滤波 后 的 结果 ; Cd) 使 用 大 小 为 5 x 5 的 几何 均 
值 滤波 器 对 图 (6) 滤波 后 的 结果 ; (o) 使 用 大 小 为 5 x 5 的 中 值 滤波 器 对 图 (b) 滤波 后 的 
结果 ; (使 用 大 小 为 5x5 且 d=5 的 修正 的 阿尔 法 均值 滤波 器 对 图 (b) 滤波 后 的 结果 
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5.3.3 自 适 应 滤波 器 

迄今 为 止 讨论 的 用 于 图 像 处 理 的 滤波 器 ， 并 未 考虑 图 像 中 的 一 点 对 其 他 点 的 特征 变化 。 本 节 考 虑 
两 个 简单 的 自 适应 滤波 器 , 滤波 器 的 特性 变化 以 m x 矩形 窗口 Sy 定义 的 滤波 器 区 域内 图 像 的 统计 特 
性 为 基础 。 如 下 面 的 讨论 所 表明 的 那样 ， 自 适应 滤波 器 的 性 能 要 优 于 迄今 为 止 讨论 过 的 所 有 滤波 器 的 
性 能 。 改 善 滤波 能 力 的 代价 是 滤波 器 的 复杂 度 提高 了 。 记 住 ， 我 们 一 直 在 处 理 这 样 的 情况 ， 即 退化 图 
像 等 于 原始 图 像 加 噪声 ， 但 还 没有 考虑 其 他 类 型 的 退化 。 


自 适应 局 部 降低 噪声 滤波 器 

随机 变量 最 简单 的 统计 度量 是 其 均值 和 方差 。 作 为 自 适应 滤波 器 的 基础 ， 它 们 是 合理 的 参数 ， 因 
为 它们 是 与 图 像 外 观 紧密 相关 的 量 。 均 值 给 出 了 在 其 上 计算 均值 的 区 域 中 的 平均 灰 度 的 度量 ， 而 方差 
则 给 出 了 该 区 域 的 对 比 度 的 度量 。 

滤波 器 作用 于 局 部 区 域 5,。 滤 波 带 在 该 区 域 中 心 任意 一 点 (x,y) 上 的 响应 基于 以 下 4 个 量 : (a) (x,y), 
带 噪 图 像 在 点 (x, y) 上 的 值 ，(b) cy ， 污 染 f(x,y) 以 形成 g(x, ») 的 噪声 的 方差 ;(c) mi, Sy 中 像素 的 局 
部 均值 ，(d) o7, Sy 中 像素 的 局 部 方差 。 我 们 希望 滤波 器 的 性 能 如 下 : 


1 如果? 为 零 , 则 滤波 器 应 该 简单 地 返回 g(x,y) 的 值 。 这 无 关 紧 要 ， 在 零 噪声 情况 下 g(x,y) 等 
FL Yo 

2 如果 局 部 方差 与 ay 是 高 度 相关 的 ， 则 滤波 器 返回 g(x, 刀 的 一 个 近似 值 。 典 型 地 ， 高 局 部 方差 
与 边缘 相关 ， 并且 应 该 保护 这 些 边 缘 。 

3. 如 果 两 个 方差 相等 ， 我 们 则 希望 滤波 器 返回 Sy 中 像素 的 算术 均值 。 这 种 情况 发 生 在 局 部 区 域 
与 整个 图 像 有 相同 特性 的 条 件 下 ， 并 且 局 部 噪声 将 通过 简单 地 求 平均 来 降低 。 


基于 这 些 假设 得 到 的 f(x, y) 的 自 适应 表达 式 可 以 写成 


2 
Fs») = g0- e, »)-m,] (53-12) 
L 


唯一 需要 知道 或 估计 的 量 是 全 部 噪声 的 方差 cy 。 其 他 参数 要 从 每 个 (x, yy) 处 的 Sy 中 的 像素 来 计算 ， 
(x, 力 是 滤波 器 窗口 的 中 心 。 式 (5.3-12) 中 隐 含 的 假设 为 cy < cz 。 模 型 中 的 噪声 是 加 性 的 和 位 置 无 关 的 ， 
因此 这 是 一 个 合理 的 假设 ,因为 Sy 是 g(x, y) 的 子 集 。 人 然而 ， 我 们 很 少 有 of 的 确切 知识 ， 因 此 在 实际 
中 很 可 能 违反 这 个 条 件 。 由 于 这 个 原因 ， 式 (5.3-12) 的 实现 应 建立 一 个 测试 ， 以 便当 条 件 cy > cz RE 
时 ,把 比率 设置 为 1。 这 就 造成 了 该 滤波 器 的 非 线性 。 然 而 ， 它 可 以 防止 由 于 缺乏 图 像 噪声 方差 的 知 
识 而 产生 无 意义 结果 ( 即 负 灰 度 级 , 取决 于 mz 的 值 ) 。 男 一 种 方法 是 允许 出 现 负 值 , 并 在 最 后 重新 标定 
a Ms 因而 ， i Pak 


el 







Be) REC 与 我 


Te ee 该 结果 的 
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改进 很 大 。 从 总 体 噪 声 减 少 情况 来 看 , 自 适应 滤波 器 所 达到 的 效果 与 算术 和 几何 均值 滤波 器 的 相似 : 然而 ， 
使 用 自 适 应 滤波 器 滤波 后 的 图 像 更 清晰 一 些 。 例 如 , 在 图 5.13 F, 图 像 顶 部 的 连接 片 更 为 清晰 。 其 他 特 
PE, 如 孔 和 图 像 左 下 方 较 暗部 件 的 8 根 引 脚 等 , 在 图 5.13 (d) 中 更 加 清楚 。 这 些 结果 是 使 用 自 适 应 滤波 器 所 
能 达到 的 典型 结果 。 如 在 早 些 时 候 提 到 过 的 那样 ， 改进 性 能 的 代价 是 增加 了 滤波 器 的 复杂 性 。 

上 面 的 结果 中 对 oa? 用 了 一 个 值 , 该 值 准 确 地 与 噪声 方差 匹配 。 若 该 值 未 知 ， 且 使 用 了 太 低 的 估计 值 ， 
则 算法 会 因为 校正 量 比 应 有 的 小 而 返回 与 原 图 像 非常 接近 的 图 像 。 估 计 值 太 高 则 会 造成 方差 的 比率 在 1.0 
处 被 前 平 ， JEEE EETA FEAR a PRAE 
新 标定 ， 则 如 前 所 述 ， 结 果 将 损失 动态 范围 。 ， Lo 





图 5.13 (a) 被 均值 为 零 、 方 差 为 1000 的 加 性 高 斯 噪声 污染 的 图 像 ; (b) 算术 均值 滤波 的 结果 ; 
(c) 几何 均值 滤波 的 结果 ; (d) 自 适 应 降 噪 滤波 的 结果 。 所 有 滤波 融 的 大 小 均 为 7x 7 


自 适应 中 值 滤波 器 
对 于 5.3.2 节 讨 论 的 中 值 滤波 器 ， 只 要 脉冲 噪声 的 空间 密度 不 大 ， 人 性 能 就 会 很 好 (根据 经 验 ， 忆 和 
P; 小 于 0.2) 。 本 节 将 证 明 ， 自 适应 中 值 滤波 可 以 处 理 具有 更 大 概率 的 脉冲 噪声 。 自 适应 中 值 滤波 天 
的 另 一 个 优点 是 ,平滑 非 脉冲 噪声 时 会 试图 保留 细节 ， 这 是 传统 中 值 滤波 器 所 做 不 到 的 。 正 如 前 面 
几 节 中 讨论 的 所 有 滤波 器 一 样 ;， 自 适应 中 值 滤波 器 也 工作 在 矩形 窗口 区 域 Sy 内。 然而， 与 这 些 滤波 
器 不 同 的 是 ， 自 适应 中 值 滤波 器 在 进行 滤波 处 理 时 ， 会 根据 本 节 列 举 的 某 些 条 件 改变 RAR) Sy 的 
尺寸 。 记 住 ， 滤 波 器 的 输出 是 单个 数值 ， 该 值 用 于 代替 点 (zx y) 处 的 像素 值 ， 点 (x, y) 是 给 定时 刻 窗口 
Su 的 中 心 
考虑 如 下 符号 : 
Znin = Ss 中 的 最 小 灰 度 值 
zmax = Sy P 的 最 大 灰 度 值 
Zma = Sy 中 的 灰 度 值 的 中 值 
Zy = 坐标 (x, 处 的 灰 度 值 
Su = Sy 允许 的 最 大 尺寸 
自 适应 中 值 滤波 算法 以 两 个 进程 工作 ， 分 别 表 示 为 进程 4 和 进程 83， 如 下 所 示 : 
进程 4: . Al = zined— Zmin 
A? = Zmed — Zmax 
如 果 41>0 且 As<0， 则 转 到 进程 B 
否则 增 大 窗口 尺寸 
如 果 窗 口 尺寸 <Smwsx， 则 重复 进程 A 
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进程 B: By = Zy = Zmin 
Bo = Zig) = Zax 
WLR B,>0 AB, <0, MH Zy 
否则 输出 Zied 
理解 该 算法 的 关键 在 于 , 要 记 住 它 有 3 个 主要 目的 : 去 除 椒盐 (脉冲 ) 噪 声 , 平滑 其 他 非 脉冲 噪声 ， 
并 减少 诸如 物体 边界 细 化 或 粗 化 等 失真 。 值 san 和 Zma 在 算法 统计 上 认为 是 类 脉冲 噪声 成 分 ， 即 使 它 
们 在 图 像 中 并 不 是 最 低 和 最 高 的 可 能 像素 值 。 
利用 这 些 观 察 结果 ,我 们 看 到 ,进程 4 的 目的 是 确定 中 值 滤波 器 的 输出 zmes 是 否 是 一 个 脉冲 ( 黑 
或 白 ) 。 如 果 条 件 Zmin < Zmed < zmax 有 效 ， 则 根据 前 节 提 到 的 原因 ，zwes 不 可 能 是 脉冲 。 在 这 种 情况 
下 ,我 们 转 到 进程 3 进行 测试 ， 看 窗口 z 的 中 心 点 本 身 是 否 是 一 个 脉冲 (回忆 可 知 zw 是 正 被 处 理 
的 点 ) 。 若 条 件 B1 > 0 AB, < 0 为 真 ， 则 zwin < zy < zmax，zw 就 不 是 脉 囊 ， 原因 与 zmes 不 是 脉冲 相 
同 。 在 这 种 情况 下 ， 算 法 输出 一 个 不 变 的 像素 值 zw。 通 过 不 改变 这 些 “ 中 间 灰 度 级 ”的 点 ， 减 少 
图 像 中 的 失真 。 如 果 条 件 B > 0 且 B <0 为 假 ， 则 25 = zmin 或 z= zmax。 在 任何 一 种 情况 下 ， 像 素 
值 都 是 一 个 极端 值 , 是 算法 输出 中 值 meas, 从 进程 4 可 知 sid 不 是 噪声 脉冲 。 最 后 一 步 是 执行 标准 
的 中 值 滤波 。 问 题 是 ,标准 中 值 滤 波 器 使 用 图 像 中 相应 邻 域 的 中 值 代替 该 图 像 中 的 每 一 点 ， 这 会 
引起 不 必要 的 细节 损失 。 
继续 上 面 的 说 明 , 假设 进程 4 确实 找到 了 一 个 脉冲 ( 若 失 败 则 测试 会 将 它 转 到 进程 B) 。 然 后 , 算法 会 
增 大 窗口 尺寸 并 重复 进程 4。 该 循环 会 一 直 继续 ， 直 到 算法 找到 一 个 非 脉 冲 的 中 值 (并 跳 转 到 进程 B) , 或 
者 达到 了 窗口 的 最 大 尺寸 。 如 果 达 到 了 窗口 的 最 大 尺寸 ， 则 算法 返回 zwea 值 。 注 意 ， 不 能 保证 该 值 不 是 
一 个 脉冲 。 噪 声 的 概率 已 和 /或 P 越 小 ; 或 Sm 在 允许 的 范围 内 越 大 ， 过 早退 出 条 件 发 生 的 可 能 性 就 会 
越 小 。 这 似乎 是 合理 的 。 随 着 脉冲 密度 的 增 大 ， 我 们 会 需要 更 大 的 窗口 来 消除 尖峰 噪声 。 
算法 每 输出 一 个 值 , 窗口 Su 就 被 移 到 图 像 中 的 下 一 个 位 置 。 然 后, 算法 重新 初始 化 并 应 用 到 新 位 
置 的 像素 。 如 习题 3.18 指出 的 那样 ， 仅 使 用 新 像素 就 可 以 反复 更 新 中 值 ， 因 而 减少 了 计算 开销 。 


例 5.5” 自 适应 中 值 滤波 的 说 明 。 

图 5.14(a) 是 被 概率 为 P= P, = 0.25 的 “椒盐 ” 噪声 污染 的 电路 板 图 像 ， 该 噪声 的 概率 为 图 5.10 (a) 中 
所 用 噪声 概率 的 2.5 倍 。 此 处 噪声 水 平 非常 高 ， 以 至 于 模糊 了 图 像 的 大 部 分 细节 。 作 为 比较 的 基础 ， 图 像 首 
先 使 用 最 小 中 值 滤波 器 进行 滤波 , 消除 大 部 分 可 见 的 脉冲 噪声 痕迹 。 做 这 种 处 理 需 要 一 个 大 小 为 7x7 的 中 值 
滤波 器 ， 并 且 处 理 结果 显示 在 图 5.14(b) 中 。 虽然 噪声 被 有 效 地 消除 ， 但 该 滤波 明显 导致 了 图 像 细 节 的 损失 。 
例如 ， 图 像 顶部 的 一 些 连接 片 出 现 了 失真 或 断裂 。 其 他 的 图 像 细节 也 同样 失真 了 。 





15.14 ” (a) 被 概率 P, = P, = 0.25 的 椒盐 噪声 污染 的 图 像 (b) 使 用 大 小 为 7x7 的 中 值 滤波 器 
的 对 图 像 滤 波 的 结果 ; (c) 使 用 Sw = 7 的 自 适应 中 值 滤波 器 对 图 像 滤 波 的 结果 


图 5.14 (©) 是 使 用 Soo = 的 站 适应 中 值 滤波 器 的 结果 。 噪声 消除 性 能 与 中 值 滤波 器 相似 。 但 是 ， 自 适 
应 滤波 器 在 保持 清晰 度 和 细节 方面 的 确 做 得 更 好 。 连 接 片 几乎 没有 失真 ， 使 用 中 值 滤波 器 时 被 模 枯 或 失真 
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而 无 法 识别 的 一 些 特征 ， 在 图 5.14(c) 中 变 得 更 清晰 。 两 个 明显 的 例子 是 穿 透 主板 的 小 白 孔 ， 以 及 图 像 左下 
四 分 之 一 处 有 8 根 引 脚 的 黑色 器 件 。 

考虑 到 图 5.14 @) 中 的 高 水 平声 ， 自 适应 算法 的 性 能 已 经 非常 好 。 允许 选择 的 最 大 窗口 尺寸 取决 于 应 
用 ， PATIRE A ATER EERDERE, OEE AEREN 
期 望 性 能 建立 直观 的 基准 。 


5.4 用 频率 域 滤波 消除 周期 噪声 


用 频率 域 技术 可 以 有 效 地 分 析 并 滤 除 周期 噪声 。 这 种 技术 的 基本 概念 是 在 传 里 叶 变换 中 ， 周 期 噪声 
在 对 应 于 周期 干扰 的 频率 处 ， 以 集中 的 能 量 脉冲 形式 出 现 ;方法 是 用 一 个 选择 性 滤波 器 分 离 出 噪声 ( 见 
4.10 节 )。 在 5.4.1 WE] 5.4.3 区 中 ， 为 消除 基本 的 周期 噪声 ， 将 使 用 三 种 类 型 的 选择 性 滤波 器 (4.10 节 中 
介绍 过 的 带 阻 、 带 通 和 陷 波 滤波 器 ) 。 在 5.4.4 节 中 ， 我们 还 将 介绍 一 种 最 佳 陷 波 方法 。 


5.4.1， 带 阻 滤波 器 


4.10.1 节 中 介绍 的 理想 、 布 特 沃 斯 和 高 斯 带 阻 滤波 器 的 传递 函数 总 结 在 表 4.6 Po 图 5.15 显示 了 这 
些 滤波 器 的 透视 图 ， 并 且 下 面 的 例子 说 明了 使 用 一 个 带 阻 滤波 器 降低 周期 噪声 的 效果 。 


abc 





ð 
图 5.15 从 左 到 右 依次 为 理想 滤波 器 、 布 特 沃 斯 滤波 器 ( 阶 数 为 0) 和 高 斯 带 阻 滤波 器 的 透视 图 


例 5.6 ”使 用 带 阻 滤波 器 消除 周期 性 噪声 。 

带 阻 滤波 器 的 主要 应 用 之 一 是 ， 在 频率 域 曲 声 成 分 的 一 般 位 置 近似 已 知 的 应 应 用 中 消除 噪声 。 一 个 典型 
的 例子 就 是 一 幅 被 加 性 周期 噪声 污染 的 图 像 ， 该 噪声 可 被 近似 为 二 维 正弦 函数 。 不 难看 出 ， 一 个 正弦 波 的 
傅 里 叶 变换 由 两 个 脉冲 组 成 ， 它 们 是 关于 变换 域 坐标 原点 互 为 镜像 的 图 像 。 它 们 的 位 置 在 表 43 中 给 出 。 
两 个 脉冲 实际 上 都 是 虚 的 (正弦 昌 线 的 傅 里 叶 变 换 的 实 部 为 零 ) ， 而 且 彼此 复 共 生 。 我 们 在 5.4.3 节 和 544 
节 中 还 将 详 述 该 主题 。 目 前 ， 我 们 的 目的 是 先 说 明 带 阻 滤波 器 。 

图 $.16(a) 与 图 5.5 (a) 相同 ， 显示 了 被 不 同 频率 的 正弦 噪声 严重 污染 的 图 像 。 噪 声 成 分 可 视 为 图 5 16 (b) 

显示 的 傅 里 叶 频 谱 中 的 对 称 亮点 对 。 本 例 中 ,噪声 成 分 位 于 关于 变换 原点 的 近似 贺 上 ， 因 此 使 用 圆 对 称 

带 阻 滤波 器 是 正确 的 选择 。 图 5.16 (c) 显示 了 一 个 4 阶 布 特 沃 斯 带 阻 滤波 器 ， 它 设置 了 适当 的 半径 和 宽 
度 ， 完 全 包围 了 噪声 脉冲 。 由 于 通常 希望 变换 要 尽 可 能 小 地 消除 细节 ， 因 此 在 带 阻 滤波 中 通常 要 求 尖锐 
的 窄 滤波 器 。 使 用 该 滤波 器 对 图 5.16 (a) 滤波 的 效果 见 图 5.16 (d) ， 改 进 非 常 明显 。 即 使 细小 的 细节 和 纹 
理 也 被 这 一 简单 的 滤波 方式 有 效 地 修复 了 。 还 应 注意 ， 使 用 小 卷 积 模板 的 直接 空间 域 滤 波 方法 不 可 能 取 
得 相同 的 结果 。 


5.4.2 ” 带 通 滤波 器 


带 通 滤波 器 执行 与 带 阻 滤波 器 相反 的 操作 。4.10.1 节 介 绍 了 如 何 通 过 式 (5.4-1) 使 用 传递 函数 为 B57 


Hop (u,v) 的 带 阻 滤波 器 得 到 带 通 滤波 器 的 传递 函数 H pp (u,v) : 
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A gp (u,v) = 1— Hpg (u,v) (5.4-1) 
作为 练习 (见习 题 5.12) ， 请 读者 根据 表 4.6 EP Ere ELIS De ae Fee MUAY i N 


abcd 














图 5.16 (a) 被 正弦 噪声 污染 的 图 像 ;(b) 图 (a) 的 谱 ; 〈c) ARRE 
滤波 器 (白色 代表 1) ; (d) 滤波 的 结果 ( 原 图 像 由 NASA 提供 ) 


例 5.7 使 用 带 通 滤波 提取 了 品 声 模式 。  ， 

通常 我 们 不 会 在 一 幅 图 像 上 直接 执行 带 通 滤波 ， 因为 这 样 会 消 
除 太 多 的 图 像 细 节 。 然 而 ， 带 通 滤波 在 一 幅 图 像 中 屏蔽 选中 频段 导 
致 的 效果 时 非常 有 用 , 如 图 $.17 中 的 说 明 。 产 生 这 幅 图 像 的 方法 是 ， 
(1) 应 用 式 (5.4-1) 得 到 与 图 5.16 中 使 用 的 带 阻 滤波 器 相对 应 的 带 通 | 
滤波 器 ; (2) 取 带 通 滤波 变换 的 反 变换 。 使 用 这 种 方法 会 丢失 图 像 ” 
的 大 部 分 细节 ， 不 过 保留 的 信息 是 非常 有 用 的 。 显 然 , 使 用 这 种 方 
法 复原 的 噪声 模式 与 图 5.16 (a) 中 污染 图 像 的 噪声 非常 接近 。 换 句 话 
说 ， 带 通 滤波 帮助 屏蔽 了 噪声 模式 。 这 是 一 个 有 用 的 结果 ， 因为 它 。 图 5 17 由 带 通 滤波 获得 的 图 5.16(4) 
简化 了 噪声 分 析 ， 而 与 图 像 内 容 无 关 。 所 示 图 像 的 噪声 图 案 


5.4.3 ” 陷 波 滤 波 器 


陷 波 滤波 器 阻止 (或 通过 ) 事 先 定义 的 中 心 频率 的 邻 域 内 的 频率 。 陷 波 滤波 的 公式 详 见 4.10.2 1 
图 5.18 分 别 显示 了 理想 、 布 特 沃 斯 和 高 斯 陷 波 ( 带 阻 ) 滤 波 需 的 三 维 图 。 由 于 伟 里 叶 变 换 的 对 称 性 ， 要 
获得 有 效 的 结果 ， 陷 波 滤波 器 必须 以 关于 原点 对 称 的 形式 出 现 。 这 个 原则 的 特例 是 ， 如 果 陷 波 滤波 器 
位 于 原点 处 ， 在 这 种 情况 下 ， 陷 波 滤波 器 是 其 本 身 。 虽 然 为 便于 说 明 的 目的 ， 我 们 只 列举 了 一 对 陷 波 
滤波 器 ， 但 可 实现 的 陷 波 滤波 融 的 对 数 是 任意 的 。 陷 波 区 域 的 形状 也 可 以 是 任意 的 (例如 矩形 ) 。 








图 5.18 (a) 理想 、(b) 布 特 沃 斯 (2 阶 ) 和 (ce) 高 斯 陷 波 ( 带 阻 ) 滤 波 器 的 透视 图 


如 4.10.2 节 中 描述 的 那样 ， 我 们 可 以 得 到 通过 而 非 抑制 陷 波 区 域 中 所 包含 频率 的 陷 波 滤波 器 。 因 
为 这 些 滤 波 器 执行 与 陷 阻 滤波 器 完全 相反 的 功能 ， 故 它们 的 传递 函数 由 下 式 给 出 : 
Hyp (u,v) = 1— Hyp (u,v) (5.4-2) 
| 式 中 ,Hplu, YW) 是 陷 波 ( APE VEVA EE RR AANU CHF) 滤波 器 与 传递 函数 为 Hyrlu, VAIRA CHF 
359 阻 ) 滤 波 器 相对 应 。 
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例 5.8 用 陷 波 滤波 器 消除 周期 性 噪声 。 

图 5.19 (a) 显示 了 与 图 4.51(a) 相 同 的 图 像 。 以 下 的 陷 波 滤波 方法 会 降低 该 图 像 中 的 噪声 ， 而 不 会 引入 
我 们 在 4.8.4 节 中 看 到 的 明显 模糊 。 除非 该 节 中 我 们 说 明 模 糊 是 我 们 所 希望 的 , 否则 找到 一 个 合适 的 滤波 融 
后 ， 陷 波 滤 波 会 更 好 一 些 。 

观察 图 5.19 (a) 中 近似 水 平 线 的 噪声 模式 ,我 们 希望 它 在 频率 域内 的 成 分 沿 垂直 轴 集 中 。 然 而 ,图 5.19 (b) 
所 示 的 谱 表 明 ， 噪声 没有 明显 到 具有 足够 清楚 的 模式 。 通 过 沿 傅 里 叶 变 换 的 垂直 轴 构 建 一 个 简单 的 理想 陷 波 带 
通 滤波 器 ， 我 们 可 以 得 到 噪声 成 分 的 外 表 特 征 ， 如 图 5.19(c) 所 示 。 噪 声 模式 的 空间 表示 ( 陷 波 带 通 滤波 结果 
的 反 变 换 ) 见 图 5.19(d) 。 这 种 噪声 模式 与 图 $.19 (a) 中 的 模式 相对 应 。 创 建 一 个 以 合理 程度 屏蔽 噪声 的 合 
适 陷 波 带 通 滤波 器 后 , 我们 可 由 式 (5.4-2) 获 得 相应 的 陷 波 带 阻 滤波 器 - 使 用 陷 波 带 阻 滤波 器 处 理 图 像 后 的 
结果 见 5.19(e)。 该 图 像 与 图 5.19 (a) 相 比 ， 包 含有 几乎 看 不 见 的 噪声 扫描 线 。 





图 5.19 (a) 佛罗里达 和 墨西哥 湾 的 卫星 图 像 ， 显 示 有 水 平 扫描 线 ;，(b) 图 (a) 的 谱 ; (c) HITE (b) 
上 的 陷 波 带 通 滤波 器 ;(d) 空间 噪声 模式 ; (e) 陷 波 带 阻 滤波 的 结果 ( 原 图 像 由 NOAA 提供 ) 


5.4.4 ”最 佳 陷 波 滤波 


作为 周期 性 图 像 退 化 的 另 一 个 例子 , 图 5.20 (a) 显示 了 “水手 6 号 ”飞船 拍摄 的 火星 地 形 数字 图 像 。 
其 干扰 模式 与 图 5.16 (a) 中 显示 的 类 似 ,但 前 者 的 模式 更 为 精细 , 因而 在 频率 平面 上 更 难 检测 。 图 5.20 (b) 
显示 了 该 问题 图 像 的 傅 里 叶 谱 。 类 似 星 形 的 成 分 是 由 干扰 引起 的 ， 而 且 存在 几 对 成 分 ， 指 出 该 模式 包 
含 不 止 一 个 正弦 成 分 。 

存在 几 种 干扰 成 分 时 ， 就 不 能 采用 前 面 几 节 讨论 的 方法 ， 因 为 它们 在 滤波 过 程 中 可 能 会 消除 太 多 
的 图 像 信息 ( 当 图 像 很 特别 或 很 难 获取 时 ， 很 不 希望 出 现 这 种 现象 ) 。 另 外 ， 干 扰 成 分 通常 不 是 单 频 脉 
冲 。 相 反 ， 它 们 通常 具有 携带 干扰 模式 信息 的 宽 边 缘 。 从 正常 的 变换 背景 中 有 时 不 容易 检测 到 这 些 边 
缘 。 在 许多 应 用 中 ， 降 低 这 些 退化 影响 时 选择 滤波 方法 将 非常 有 用 。 这 里 讨论 的 方法 是 最 佳 的 ， 因 为 
在 一 定 意义 上 ， 它 最 小 化 了 复原 的 估计 值 fE, y) 的 局 部 方差。 


360 
361 
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图 5.20 (a)“ 水 手 6 号 ”飞船 拍摄 的 火星 地 形 图 像 ;(b) 显示 有 周期 干扰 的 传 里 叶 谱 (图 像 由 NASA 提供 ) 





该 过 程 由 两 步 组 成 ， 第 一 步 是 屏蔽 干扰 的 主要 成 分 ， 第 二 步 从 被 污染 图 像 中 减 去 该 模式 的 一 个 可 
变 加 权 部 分 。 虽 然 我 们 是 在 一 个 特定 的 应 用 中 来 研究 这 一 过 程 ， 但 这 一 基本 方法 仍然 十 分 通用 ， 而 且 
能 应 用 到 其 他 复原 工作 中 ， 即 多 周期 性 干扰 是 主要 问题 的 复原 工作 。 
第 一 步 是 提取 干扰 模式 的 主 频 率 成 分 。 像 之 前 那样 ， 这 可 通过 在 每 个 尖峰 处 放置 一 个 陷 波 带 通 滤 
波 器 Hyp(u, y) 来 完成 。 如 果 滤 波 器 构建 为 只 可 通过 与 干扰 模式 相关 的 成 分 ， 那 么 干扰 噪声 模式 的 傅 里 
叶 变 换 由 下 式 给 出 ; 
N(u,v) = Hyp (u,v)G(u, v) (5.4-3) 
其 中 ， 如 通常 那样 ，G(u, v) 仍 为 被 污染 图 像 的 傅 里 叶 变 换 。 
Hyelu, v) 的 形式 需要 多 方面 判断 哪些 是 尖峰 噪声 干扰 。 为 此 ， 通 常 要 通过 观察 显示 的 G(u, v) 的 频 
谱 来 交互 地 创建 陷 波 带 通 滤波 器 。 选 择 一 个 特殊 滤波 器 之 后 ， 空 间 域 中 的 相应 模式 可 由 下 式 获 得 ; 
mx, y) = 3! {Hyp (u,v)G(u, v)} (5.4-4) 
因为 被 污染 图 像 假设 是 由 未 污染 图 像 f(x,y) 与 干扰 相 加 形成 的 ， 车 zx%, y)FE ELA, WWM g(x, y) 减 去 
该 干扰 模式 得 到 f(x,y) 将 是 非常 简单 的 事情 。 当 然 , 问题 是 这 个 滤波 过 程 通常 只 会 得 到 真实 干扰 模式 
的 近似 值 。 在 n(x,y) 的 估计 中 ,不 存在 的 那些 成 分 的 影响 可 以 被 最 小 化 , 方法 是 从 g, VPE NA, y) 
的 一 个 加 权 部 分 来 得 到 f(x,y) 的 估计 值 ， 如 下 所 示 : 


~ 


F(x, y) = g(x,y) — w(x, yx, y) (5.4-5) 
其 中 ,如 先前 那样 ，f(x, y) 是 了 (x,y) 的 估计 值 ， 而 wx,») 则 待定 。 KE w(x, 7) 称 为 加 权 函 数 或 调制 函 
数 ， 这 个 过 程 的 目的 就 是 选取 该 函数 ， 以 便 以 某 种 有 意义 的 方法 来 优化 结果 。 一 种 方法 是 选取 w(x, y), AE 
估计 值 S E, y) 在 每 一 点 (x, y) 的 指定 邻 域 上 的 方差 最 小 。 
考虑 关于 点 (x, y) 的 大 小 为 (2a + 1)(2b + 1) 的 邻 域 。 在 坐标 (x, y) 处 ， f(x,y) 的 局 部 方差 可 根据 样本 
估计 ， 如 下 所 示 : 


l a b AJ 2 . 
2 = A > 
o (x, = (2a +1)(2b +1) > re yd Fy (5.4-6) 


s=-at=—b 


RH, F(x, 是 该 邻 域内 六 的 平均 值 ， 即 
a b 


p 1 ~ ， 
SSS À ‘(x+s,y (5.4-7) 
f(x,y) ashe 2 Se +8, 948) 


=-at=- 


在 图 像 边 缘 上 或 接近 图 像 边缘 的 点 上 ， 可 用 局 部 邻 域 或 0 填充 的 方法 处 理 。 
63 


把 式 (5.4-5) 代 入 式 (5.4-6) ， 得 
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a b 
2 = 1 TET = 
o rr Da nites 


w(x+s,y+t)n(x+s,y+t)]—[Z(x, y)— w(x, y)n (x,y)]}? 
假设 w(x,y) 在 整个 邻 域内 基本 保持 不 变 ， 则 当 -a < s <a 和 -bp <t<4b 时 ， 可 给 出 近似 式 


w(x+s, y+1) = w(x, y) (5.4-9) 
这 一 假设 在 该 邻 域 内 也 可 得 出 如 下 表达 式 : 


w(x, p(X,y) = w(x, y) (x, y) (5.4-10) 
由 这 些 近 似 ， 式 (5.4-8) 变 为 
1 a b | 
j = apari ty wa (54-11) 


w(x, yn +s, y +t) ]-[B (x, y) -= w(x, yT (x, YF? 
为 最 小 化 o (x,y)， 解 下 式 得 到 wa, y): 


2 
SeN o (5.4-12) 
w(x, y) 
结果 为 
g yna, y) -gx y), y) 
1 (x,y) -7 (x,y) 

要 获得 复原 图 像 f(x, y) ， 可 根据 式 (5.4-13) 计 算 w(x, y)， 然 后 使 用 式 (5.4-5) 。 若 w(x, 在 某 一 邻 域内 
假设 为 常量 , 则 不 必 对 图 像 中 的 每 个 x 和 y 值 计算 该 函数 , 而 是 在 每 个 非 重 释 邻 域 的 一 点 (一 般 为 中 心 
点 ) 计 算 w(x,)， 然 后 用 它 来 处 理 该 邻 域内 包含 的 所 有 图 像 点 。 


例 5.9 最 佳 陷 波 滤波 的 说 明 。 

图 5.21 到 图 5.23 显示 了 对 图 5.20 (a) 应 用 前 述 技术 处 理 后 的 
效果 。 该 图 像 的 大小 为 512 x 512 像素 ,并且 选择 了 a =b = 15 
的 邻 域 。 图 5.21 显示 了 被 污染 图 像 的 傅 里 叶 谱 。 在 这 种 特殊 情 
况 下 ,原点 未 移 到 频率 平面 的 中 心 ， 因 此 w=v=0 在 图 5.21 所 
示 变 换 图 像 的 左上 角 。 图 5.22 (a) 显示 了 Mu, v) 的 谱 ， 其 中 只 存 
在 尖峰 噪声 。 图 5.22 (b) 显示 了 取 Mu, v) 的 信里 叶 反 变换 得 到 的 
干扰 模式 zx, y) 注意, 这 个 干扰 模式 与 图 5.20 (a) 中 存在 的 噪声 a i 
结构 很 相似 . 最 后 , 图 $23 显示 了 应 用 式 (5.4.5) 处 理 后 得 到 的 图 图 521 | 
像 。 出 于 实用 的 目的 ， 周 期 干扰 已 被 消除 。 i à 


w(x, y) = 





(5.4-13) 








ap facil a b 


图 5.22 (a) Nu, v) RREI; (b) 相应 的 噪声 ‘ 
干扰 模式 7 (x, y) (图 像 由 NASA 提供 ) 图 523 
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5.5 线性、 位置 不 变 的 退化 
图 像 复原 前 ， 图 5.1 中 的 输入 /输出 关系 可 以 表示 为 


g(x, y)=A[f(x, y)]+n(x, y) (5.5-1) 
现在 ， 让 我 们 假设 w(x,y)=0， 则 g(x, y) =H f(x, y)]. HEF 2.6.2 节 的 讨论 ， 如 果 
H [afi (x, y) +b (a, y)]=aH[ f(x, y)]+bH [A »)] (5.5-2) 


WAS H 7S, Hp a 和 4b 是 标量 ，fi(x, DAAE, 7 是 两 : 
LD 关于 线性 系统 理论 的 简要 回 
4 a=b=1, W3 (5.5-2) BH 


H| fy) +A y)=A[A»]+ F(A») (5.5-3) 
这 就 是 所 谓 的 加 性 。 这 一 特性 简单 地 表明 ， 如 果 五 为 线性 算 子 , 那么 两 个 输入 之 和 的 响应 等 于 两 个 响 
应 之 和 。 
如 果 AC, y)=0, 则 式 (5.5-2) 变 为 
H [afi (x, y)]= aH [f(x »)] (5.5-4) 
我 们 称 之 为 均匀 性 。 它 表明 任何 与 常数 相 乘 的 输入 的 响应 ， 等 于 该 输入 响应 乘 以 相同 的 常数 ， 即 一 个 
线性 算 子 具有 加 性 和 均匀 性 。 
一 个 算 子 对 于 任意 ftx, y)，a 和 pp， 如 果 
H[f(x-a,y-pP)]=g(x-a, y-p) (5.5-5) 
则 输入 /输出 关系 满足 gx, y) = Hf (x, 的 算 子 称 为 位 置 (或 空间 ) 不 变 系 统 。 该 定义 说 明 图 像 中 任意 一 
点 处 的 响应 只 取决 于 该 点 处 的 输入 值 ， 而 与 该 点 的 位 置 无 关 。 


在 式 (4.5-3) 中 ， 稍 微 (等 效 ) 改 变 一 下 离散 冲 激 函数 定义 的 符号 ， 
就 可 将 f(x, y) 表示 为 





fæ) =| | f(s Bo-a,y-p) da dp (5.5-6) 
再 次 假设 ix, y)=0， 然 后 把 式 (5.5-6) 代入 式 (5.5-1) 可 得 
gs) = HLF. 9]=H| | Pa, PC-0,»-paa ap] (55-7) 
如 果 RAT, HREM SIU, MA 
gf 及 = 人 [ALP (a, Bax-a, y-f)] da dp (5.5-8) 
由 于 Sp) x Aly TK, 使 用 均匀 性 可 得 
sn)=| | f(a, B)H[6(x-a, y-p)]da dp (5.5-9) 
公式 
h(x, a, y, B) = H[d(x-a, y- f)] (5.5-10) 


66) 称 为 系统 及 的 冲 激 响应 。 也 就 是 说 ， 在 式 (5.5-1) 中 ， 若 n(x, y)=0, M Aaa, y, p ERB HW 
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标 (x, yy) 处 的 一 个 冲 激 的 响应 。 在 光学 领域 ， 冲 激 为 一 个 光 点 ， 所 以 h(x, a , y, B ) 通 常 称 为 点 扩散 函数 


(PSF) 。 这 一 名 称 来 自 于 这 样 一 个 事实 ， 即 所 有 物理 光学 系统 在 一 定 程度 上 会 模糊 (扩散 ) 光 点 ， 模 糊 
程度 由 光学 部 件 的 质量 决定 。 
将 式 (5.5-10) 代 入 式 (5.5-9) ， 可 得 


gx,»)=| | f(a, Dha, a, y, P) da dp (5.5-11) 


RK KR BAe (o GEE) 积分 。 该 表达 式 是 线性 系统 理论 核心 的 一 个 基本 结果 。 它 表明 ， 如 果 
系统 玖 对 一 个 冲 激 的 响应 已 知 , 则 对 于 任意 输入 Sa, A) 的 响应 可 用 式 (5.5-11) 来 计算 。 换 句 话 说 , A 
性 系统 甩 完 全 可 由 其 冲 激 响应 来 表征 。 

如 果 玉 是 位 置 不 变 的 ， 由 式 (5.5-5) 可 得 


Hl6(x-a,y-PB)]=h(x-a, y- p) (5.5-12) 
在 这 种 情况 下 ， 式 (5.5-11) 简化 为 
a(x, oe he = ” f(a, Dha a; y -Pda ap (5.5-13) 


该 式 为 式 (4.2-20) 对 一 个 变量 的 卷 积 积分 , 并 在 习题 4.11 中 推广 到 了 二 维 情形 。 该 积分 告诉 我 们 ， 对 于 
任意 输入 f, 若 已 知 线性 系统 的 冲 激 响应 ， 则 可 计算 出 它 的 响应 g。 结 果 是 冲 激 响应 和 输入 函数 的 简单 
存在 加 性 噪声 时 ， 线 性 退化 模型 [ 见 式 (5.5-11) ] 的 表达 式 变 为 


gx =f fla, Akon a, y, p) da dB + (x,y) (55-14) 
如 果 五 是 位 置 不 变 的 ， 则 式 (5.5-14) 变 为 
a(x. =| | fa, Aha, y- B) da df +(x, y) (5.5-15) 


噪声 项 7(x, 为 的 值 是 随机 的 ， 并 假设 这 些 噪声 项 与 位 置 无 关 。 使 用 常用 的 卷 积 符号 ， 可 将 式 (5.5-15) 
写 为 


g(x,y) = h(x, yw f (x, y)+ n(x, y) (5.5-16) 
或 者 基于 卷 积 定理 ( 见 4.6.6 节 ) ， 可 在 频率 域 中 将 它 表 示 为 
G(u,v) = H(u,v)F (u,v) + N(u,v) (5.5-17) 


这 两 个 表达 式 与 式 (5.1-1) 和 式 (5.1-2) 是 一 致 的 。 记 住 ， 对 于 离散 值 来 说 ， 所 有 的 乘积 是 逐 项 相 乘 的 。 
例如 ， = V)F(u, VV) 的 立项 是 Alu, vy ij HA Flu, Vv) 的 立项 的 乘积 。 

， 前 述 讨论 表明 ， 具 有 加 性 噪声 的 线性 空间 不 变 退 化 系统 ， 可 在 空间 域 建 模 为 退化 (点 扩散 ) 
aot 然后 再 加 上 噪声 。 基 于 卷 积 定理 ， 在 频率 域 中 ， 同 样 的 过 程 可 表示 为 图 像 和 
退化 函数 的 变换 的 乘积 ， 然 后 再 加 上 噪声 的 变换 。 在 频率 域 中 工作 时 ， 可 以 使 用 4.11 节 中 讨论 的 一 种 
FFT 算法 。 还 应 记 住 ， 如 4.6.6 节 所 述 ， 在 实现 离散 傅 里 叶 变换 时 ， 需 要 对 函数 进行 填充 。 

许多 类 型 的 退化 可 近似 为 线性 、 位 置 不 变 的 过 程 。 这 种 方法 的 优点 是 ， 可 以 使 用 许多 线性 系统 理 
论 的 工具 来 解决 图 像 复原 问题 。 与 位 置 有 关 的 非 线 性 技术 虽然 更 普遍 (通常 会 更 精确 ) ， 但 它们 会 带 来 
没有 已 知 解 的 问题 ， 或 解决 计算 问题 时 非常 困难 。 本 章 主 要 介绍 线性 、 空 间 不 变 的 复原 技术 。 由 于 退 
化 被 建 模 为 卷 积 的 结果 ， 并 且 图 像 复原 试图 找到 应 用 相反 过 程 的 滤波 器 ， 所 以 术语 图 像 去 卷 积 通常 用 
于 表示 线性 图 像 复 原 。 同 样 ， 用 于 复原 处 理 的 滤波 器 通常 称 为 去 郑 积 滤波 器 。 
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5.6 估计 退化 函数 


在 图 像 复 原 时 ， 主 要 有 3 种 用 于 估计 退化 函数 的 方法 : (1) 观察 法 ，(2) 试 验 法 ，(3) 数 学 建 模 法 。 
以 下 几 贡 将 讨论 这 些 方法 。 使 用 以 某 种 方式 估计 的 退化 函数 来 复原 一 幅 图 像 的 过 程 ， 有 时 称 为 盲 去 卷 
积 ， 因 为 真正 的 退化 函数 很 少 能 完全 知晓 。 


5.6.1 图 像 观察 估计 


假设 我 们 有 -- 幅 退化 图 像 ， 而 没有 关于 退化 函数 瑟 的 任何 知识 。 基于 图 像 被 线性 、 位 置 不 变 的 过 程 退 
化 的 假设 ,估计 五 的 一 种 方法 就 是 从 图 像 本 身 来 收集 信息 。 例 如 ， 如 果 图 像 已 被 模糊 ， 则 我 们 可 以 观察 图 
像 中 包含 样本 结构 的 一 个 小 矩形 区 域 ， 如 某 一 物体 和 背景 的 一 部 分 。 为 了 降低 噪声 的 影响 我 们 可 以 寻找 
_ 个 有 很 强 信号 内 容 的 区 域 (如 高 对 比 度 区 域 ) ,下 一 步 是 处 理子 图 像 以 便 得 到 尽 可 能 不 模糊 的 结果 ,例如 ， 
我 们 可 以 使 用 锐 化 滤波 器 对 这 个 子 图 像 进行 锐 化 处 理 ， 甚 至 可 以 使 用 手工 方法 处 理 小 区 域 。 

A> gx, PREY EPMR, 2 F(x, y) 表示 处 理 过 的 子 图 像 ( 现 实 中 ， 该 图 像 是 原 图 像 在 该 区 域 
的 估计 图 像 ) 。 然后， 假设 噪声 的 影响 由 于 选择 了 一 个 强 信号 区 域 而 可 以 忽略 ， 根 据 式 (5.5-17) 可 得 

A (5.6-1) 
i F (u,v) 

根据 这 一 函数 竺 性， 然后， 我 们 可 基于 位 置 不 变 的 假设 还 原 完整 的 退化 函数 Hl Ve WA, BA Hu, v) 
的 径 向 曲线 具有 高 斯 曲线 的 近似 形状 。 我 们 可 以 利用 这 一 信息 在 更 大 比例 上 构建 一 个 有 基本 相同 形状 
的 函数 Hw)。 然 后 ， 在 下 面 几 闻 讨论 的 一 种 复原 方法 中 使 用 Hu vye 很 明显 ， 这 是 仅 在 特殊 环境 下 
使 用 的 烦琐 处 理 ， 例 如 复原 一 幅 有 历史 价值 的 老 照片 。 


5.6.2 ”试验 估计 


如 果 可 以 使 用 与 获取 退化 图 像 的 设备 相似 的 装置 ， 从 理论 上 讲 ， 得 到 准确 的 退化 估计 是 可 能 的 。 
与 退化 图 像 类 似 的 图 像 可 以 通过 各 种 系统 设置 得 到 ， 直 到 这 些 图 像 退 化 到 尽 可 能 接近 我 们 希望 复原 的 
程度 。 之 后 ， 使 用 相同 的 系统 对 一 个 冲 激 ( 小 亮点 ) 成 像 ， 得 到 退化 的 冲 激 响应 。 正 如 5.5 节 所 表明 的 
那样 ， 线 性 空间 不 变 系 统 完全 由 其 冲 激 响 应 来 表征 。 

一 个 冲 激 可 由 一 个 亮点 来 模拟 ， 该 点 应 尽 可 能 亮 ， 以 便 将 噪声 的 影响 降低 到 可 以 忽略 的 程度 。 回 
顾 可 知 ， 由 于 冲 激 的 傅 里 叶 变 换 是 一 个 常量 ， 那 么 由 式 (5.5-17) 可 得 
G(u,v) 

i ge 








H (u,v) = (5.6-2) 


其 中 ， 与 之 前 一 样 ， 函 数 GU, v) WUE ASE E, A 是 一 个 描述 冲 激 强度 的 常量 。 图 5.24 显 
示 T “MBI 





ab 
图 5.24” 冲 激 特 性 的 退化 估计 : “(a) 一 个 亮 冲 激 (放大 显示 ); (b) 图 像 处 理 ( 退 化 ) 后 的 冲 激 
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5.6.3 ” 建 模 估计 


由 于 退化 建 模 能 解决 图 像 复 原 问 题 ， 因 此 多 年 来 一 直 被 人 们 使 用 。 在 某 些 情况 下 ， 模 型 甚至 可 以 
萎 虑 引起 退化 的 环境 条 件 。 例 如 ，Hufnagel and Stanley[1964] 根 据 大 气 汕 流 的 物理 特性 提出 了 一 个 退化 
模型 ， 其 通 式 为 

H(u,v)=e hy" (5.6-3) 
式 中 , k ESTHER SEHR. RTI 5/6 之 外 ， 该 式 与 4.8.3 节 所 述 高 斯 低 通 滤波 的 形式 相 
同 .事实 上 ,高 斯 LPF 有 时 用 于 模型 淡化 , 以 便 均匀 模糊 -图 $.25 显 示 了 使 用 式 (5.6-3) 并 取 k = 0.0025 ( 剧 


Bila) ~ k= 0.001 (中 等 清流 ) A k= 0.000 25 (轻微 清流 ) 来 模拟 模糊 一 幅 图 像 时 得 到 的 例子 。 所 有 图 像 
的 大 小 均 为 480x480 像素 。 











ab 
图 5.25 ”大气 浇 流 模型 的 说 明 : (a) 可 和 忽略 的 潮流 ; (b) AGL, k=0.0025; (c) 
Him k=0.001; (qd) 轻微 满 流 ，k=0.000 25 ( 原 图 像 由 NASA 提供 ) 

建 模 的 另 一 种 主要 方法 是 ， 从 基本 原理 开始 推导 一 个 数学 模型 。 下 面 通过 详细 讨论 一 个 实例 来 解 

释 这 一 过 程 。 在 这 个 实例 中 , 图 像 获取 时 被 图 像 与 传感器 之 间 的 均匀 线性 运动 模糊 了 。 假 设 图 像 f(x,y) 

进行 平面 运动 ，x(D 和 芒 (0 分 别 是 在 x 和 了 方向 上 随时 间 变 化 的 分 量 。 和 那么， 记录 介质 (如 胶片 或 数字 

存储 器 ) 上 任意 点 的 曝光 总 数 是 通过 对 时 间 间 隔 内 瞬时 曝光 量 的 积分 得 到 的 ,图 像 系统 的 快门 在 该 时 段 

是 开 着 的 。 假 设 快 门 开关 所 用 的 时 间 非 常 得 ， 因 此 光学 成 像 过程 不 会 受到 图 像 运 动 的 干扰 。 若 设 7 为 
曝光 时 间 ， 则 有 


g(x, y)= [ir [x—x9(0), y—yo(t)] dt (5.6-4) 


AP, ge 7 为 模糊 后 的 图 像 。 
由 式 (4.5-7) ， 式 (5.6-4) 的 傅 里 叶 变 换 为 


372 
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G(u,v) = [J sere emar dy 


rts (5.6-5) 
=f f a 75,>-mO] de dy 
改变 积分 顺序 ， 式 (5.6-5) 可 写 为 
T w% æ P 
Guys | ， p | © fi-l), y- ye x J di (5.6-6) 
外 层 方 括号 内 的 积分 项 是 位 移 函 数 F[x- x0(0), y — vod) JAE R (4.6-4) 可 得 
G(u,v) = | F(u,vye 2 Olde = F(u,v) | Palo] gy (5.6-7) 
这 里 ， 最 后 一 步 是 根据 Fl(u,v) 与 1 无 关 得 出 的 。 
令 
H(u,v)= f T raO] dt (5.6-8) 
0 


式 (5.6-7) 可 表示 为 我 们 熟悉 的 如 下 形式 : 
G(u, v) = H (u, v)F (u, v) (5.6-9) 
若 运动 变量 (OF yA, WA HHA (5.6-8) 得 到 传递 函数 Hu, v)。 要 说 明 的 是 ， arig 


像 只 在 x 方向 以 给 定 速度 xo(?) = atl T TRG). “4 t=T, BRERA a. & yol?) = 
由 式 (5.6-8) 可 得 


H(u,v) = J, Tema) di = $ eraat7 dr = sin(rua)e (5.6-10) 
Tu 


上 式 表明 ,由 x= na tAk uti, HERZ, HP n HERG Afè 
iF y DEMERE, F y= btiT thie, WBRA 


如 表 43 结尾 处 解释 的 那样 我 们 
(HH u 和 "来 对 式 (56-11) 取样 ,以 | 
便 生 成 一 个 离散 滤波 器 | 


nee | 







H(u,v) = ae [x(ua + vb) et? (5.6-11) 

例 5.10 运动 引起 的 图 像 模糊 。 

图 5.26(b) 是 由 计算 图 5.26(a) 中 图 像 的 传 里 叶 变换 模糊 的 一 幅 图 像 , 其 过 程 是 用 式 (5.6-11) 中 的 Hu, v) 
乘 以 变换 ， 再 做 反 变换 。 图 像 大 小 为 688 x 688 像素 , 在 式 (5.6-11) 中 使 用 的 参数 为 a=b=0.1 和 T=1。 如 
5.8 节 和 5.9 节 讨 论 的 那样 ,从 模糊 图 像 中 复原 出 相应 的 原 图 像 会 存在 某 些 有 趣 的 挑战 , 特别 是 当 退 化 图 像 
中 存在 噪声 时 。 





图 5.26 (a) 原 图 像 ，(b) 使 用 式 (5.6-11) 中 的 函数 ， 且 4a=5= 0.1 MI T= 1 模糊 图 像 后 的 结果 
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57 WEA 


AST SA BL PR H BERR RFE. BERRE A, 或 由 前 一 节 讨 论 的 那些 方 
法 获得 。 最 简单 的 复原 方法 是 直接 做 逆 滤 波 ， 这 里 我 们 用 退化 函数 除 退 化 图 像 的 傅 里 叶 变 换 Gu, v) 来 
计算 原始 图 像 传 里 时 变换 的 估计 产 (u, v), BI 
F(u,v) = Gey) 
H(u,v) 
该 除法 是 阵列 操作 ， 如 2.6.1 节 中 定义 的 那样 ， 并 联系 式 (5.5-17) 。 用 式 (5.1-2) 的 右 侧 奉 代 式 (5.7-1) 中 
的 Glu, v)， 得 到 


(5.7-1) 


N(u,v) 
H(u,v) 
这 是 一 个 有 趣 的 表达 式 。 它 告诉 我 们 ， 即 使 知道 退化 函数 ， 也 不 能 准确 地 复原 未 退化 的 图 像 [ Fl(u, vite 
里 叶 反 变换 ]， 因 为 Nu ie 还 有 更 糟 的 情况 ， 如 果 退 化 函数 是 零 或 是 非常 小 的 值 , 则 Mu, vyHlu, v) 
很 容易 支配 估计 值 户 (u, v) 。 事 实 上 ， 这 是 经 常 出 现 的 情况 ， 下 面 很 快 会 证 明 这 一 点 。 

解决 退化 函数 为 零 或 为 非常 小 的 值 的 问题 的 一 种 方法 是 ， 限 制 滤波 的 频率 ， 使 其 接近 原点 。 
从 式 (4.6-21) 的 讨论 ， 我 们 知道 HO, 0) 在 频率 域 中 通常 是 Hu, v) 的 最 高 值 。 因 此 ， 通 过 将 频率 限制 在 
原点 附近 分 析 ， 就 碱 少 了 过 到 零 值 的 概率 。 下 面 的 例子 中 说 明了 这 种 方法 。 

15.11 WER o 

四 5.25 (0) SAAS METRES ECHO, 并 使 用 式 (5.7-1) 反 向 滤波 的 图 像 。 也 就 是 ,使 用 
的 退化 函数 是 


F (u,v) = F(u,v)+——— (5.7-2) 


Hu DS olaran" 
,中 = 


ste k= 0.002 5。 常数 M2 和 N12 是 偏 移 值 ; 它们 使 函数 居中 ， 以 便 与 居中 的 傅 里 叶 变 换 对 应 ， 就 像 前 一 
章 中 多 次 讨论 过 的 那样 。 在 这 个 例子 中 ，M= N= 480。 我 们 知道 ， 高 斯 形 函 数 没有 零 值 ， 因 此 这 里 不 用 关 
心 它 。 然 而 ， 尽 管 如 此 ， 退 化 值 变 得 非常 小 ， 以 至 于 全 着 滤 波 的 结果 上 见 图 5.27(a) ] 毫 无 用 处 。 产 生 这 
个 失败 结果 的 原因 如 式 (5.7-2) 所 讨论 的 那样 。 





图 5.27 用 式 (5.7-1) 复原 图 5.25 (b): (a) 用 全 滤波 器 的 结果 ; b) 截止 半径 为 
40 时 用 矿 的 结果 ; (ec) 半径 为 70 时 的 结果 ; (d) 半径 为 85 时 的 结果 


图 5.27 (b) 到 图 5.27 (d) 显示 了 Glu, vy Hiu, v) 的 截止 值 的 结果 ， 半 径 分 别 为 40,70 和 85。 截 止 是 通过 对 
这 个 比值 应 用 一 个 阶 数 为 10 的 布 特 沃 斯 低 通 函数 来 实现 的 。 这 在 期 望 的 半径 处 提供 了 较 尖 锐 (但 平滑 ) 的 
过 渡 。 半径 在 70 左右 时 视觉 效果 最 好 [ 见 图 5.27(€) ] , 半径 在 70 以 下 时 图 像 开 始 变 得 模糊 ， 如 图 5.27 (b) 
所 示 ， 它 是 用 半径 40 得 到 的 。 值 大 于 70 时 ， 图 像 开 始 退 化 ， 如 图 5.27(d) 所 示 ， 它 是 用 半径 85 得 到 的 。 
在 噪声 “和 窗帘” 后面 的 图 像 中 ,图像 的 内 容 几 乎 是 可 见 的 ， 但 噪声 明显 地 支配 着 该 结果 。 进 一 步 增 大 半径 
fH. 会 使 得 图 像 越 来 越 像 图 5.27 (a) 。 


373 


374 


222 数字 图 像 处 理 (第 三 版 ) 


这 个 例子 的 结果 表明 ， 一 般 直接 逆 滤 波 的 性 能 是 较 差 的 。 接 下 来 的 三 节 将 探讨 怎样 改进 直接 逆 滤 
波 的 性 能 。 


5.8 ”最 小 均 方 误差 \ 维 纳 ) 滤波 


前 一 节 讨 论 的 逆 滤 波 方法 并 未 清楚 地 说 明 怎 样 处 理 噪 声 。 本 节 讨 论 一 种 综合 退化 函数 和 噪声 统计 
特征 进行 复原 处 理 的 方法 。 该 方法 建立 在 图 像 和 噪声 都 是 随机 变量 的 
基础 上 ， 目 标 是 找到 未 污染 图 像 f 的 一 个 估计 广 ， 使 它们 之 间 的 均 方 | 量 ， WEL 268 RIE. 
误差 最 小 。 这 种 误差 度量 由 下 式 给 出 : 





=E{(f-fy} (5.8-1) 
式 中 ，E{} 是 参数 的 期 望 值 。 sz OAR ARETE. 其 中 一 个 或 男 一 个 有 零 均 值 ， 且 估计 中 的 
灰 度 级 是 退化 图 像 中 灰 度 级 的 线性 函数 。 基 于 这 些 条 件 ， 式 (5.8-1) 中 误差 函数 的 最 小 值 在 频率 域 中 由 
如 下 表达 式 给 出 


* 
F(u,v) = aed os inde G(u,v) = ha ie eh G(u,v) 
S,(u,v)|H(u,v)f +S, (u,v) |H u,v? +S, (u,v)/ S; (u,v) 


-| 1 |H (u,v)? 
一 
H(u,v) |H(u, vw) +S, (u,v)/S (u,v) 
这 里 ， 我 们 用 到 了 这 样 一 个 事实 : 一 个 复数 量 与 其 共 斩 的 乘积 等 于 该 复数 量 幅 度 的 平方 。 这 个 结果 就 
是 众所周知 的 维 纳 滤波 ， 该 概念 由 N. Wiener[1942] 首 次 提出 。 由 方 括号 中 的 项 组 成 的 滤波 器 通常 也 称 
为 最 小 均 方 误差 滤波 器 或 最 小 二 乘 误差 滤波 器 。 本 章 最 后 列 出 了 一 些 参考 资料 ， 包 括 了 维 纳 滤波 器 的 
详细 推导 过 程 。 注 意 式 (5.8-2) 的 第 一 行 ， 维 纳 滤波 器 没有 逆 滤 波 中 退化 函数 为 零 的 问题 ， 除 非 对 于 相 
同 的 u 值 和 v 值 ， 整 个 分 母 都 是 零 。 

式 (5.8-2) 中 各 项 的 意义 如 下 所 示 : 

Hu, v) = 退化 函数 

H*(u, v) = H(u, vh 

\(u, v)? = H*(u, v)H(u, v) 

S,(u, v) = |N(u, v)? = 噪声 的 功率 谱 [ 见 式 (4.6-18) ] ” 

Su, v) = |F(u, 让 = 未 退化 图 像 的 功率 谱 

与 前 面 一 样 ，H(wu, ») 是 退化 函数 的 变换 ， 而 Gu, 四 是 退化 图 像 的 变换 。 空 间 域 中 复原 的 图 像 由 频 
率 域 估 计 广 (u,v) 的 傅 里 叶 反 变换 给 出 。 注 意 ， 如 果 噪 声 为 零 ， 则 噪声 功率 谱 消失 ,并 且 维 纳 滤波 简化 
为 逆 滤 波 。 

许多 有 用 的 度量 是 以 噪声 和 未 退化 图 像 的 功率 谱 为 基础 的 ， 其 中 最 重要 的 一 种 是 信 噪 比 ， 它 在 频 
率 域 中 用 下 式 来 近似 : 


(5.8-2) 





SNR = 周一 一 一 (5.8-3) 


i D WN lu, v) PERAIRE ADS. BOR PIE OLR 4.3 中 的 性 质 7) 。 当 两 个 函数 相同 时 ， 两 个 函数 的 相关 就 变 成 了 自 相 
关 ， 该 性 质 的 右 侧 变 成 N* (u, N (u, v), EFF, v) o 类似 的 说 明 同样 适用 于 |F(w vw) 上， 即 它 是 图 像 的 自 相关 。 第 12 章 中 
将 详细 探讨 相关 。 
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该 比值 给 出 了 携带 信息 的 信号 功率 ( 即 原始 的 或 退化 的 原 图 像 ) 水 平 与 噪声 功率 水 平 的 度量 。 携 带 低 噪 
声 的 图 像 有 较 高 的 SNR， 而 携带 较 高 噪声 的 同一 幅 图 像 有 较 低 的 SNR。 这 一 比值 是 一 个 有 限 值 , 但 在 
用 于 表征 复原 算法 的 性 能 时 ， 它 是 一 个 重要 的 度量 。 

式 (5.8-1) 中 以 统计 形式 给 出 的 均 方 误差 ， 也 可 描述 为 涉及 原 图 像 和 复原 图 像 的 和 的 形式 : 


MsE=-Ł Ae fa- Ea] (5.8-4) 
x=0 y=0 
事实 上 ,如果 把 复原 图 像 考虑 为 “信和 号 ”， 而 把 复原 图 像 和 原 图 像 的 差 考 虑 为 噪声 ,那么 我 们 可 以 将 空 
间 域 中 的 信 噪 比 定义 为 


M-1N-1 
f(x,y) 
Rep ee (5.8-5) 
[re-ie] 
x=0 y=0 


f 和 上 了 越 接近 ,该 比值 就 较 大 。 有 时 ， 用 这 一 度量 的 均 方 根来 代替 ， 这 种 情况 下 ,该 比值 称 为 均 方 根 
信 骂 比 或 均 方 根 误差 。 正 如 以 前 我 们 多 次 提 到 的 那样 ， 必 须 记 住 该 定量 度量 与 感觉 的 图 像 质量 并 没有 
很 好 的 必然 关系 。 

当 我 们 处 理 白 噪声 时 ， 谱 |Nu, 站 是 一 个 常数 ， 这 大 大 简化 了 处 理 。 然 而 ， 未 退化 图 像 的 功率 谱 很 
少 是 已 知 的 。 当 这 些 量 ee 能 估计 时 ， 经 常 使 用 的 一 种 方法 是 由 下 面 的 表达 式 来 近似 式 (5.8-2) : 


2 
F(u,v) = sa A G(u,v) (5.8-6) 
H(u,v)|H (u,v) +K 


式 中 , KEAMEN, 的 所 有 项 上 的 特定 常数 。 下 面 的 几 个 例子 说 明了 这 一 表达 式 的 应 


例 5.12， 逆 滤波 和 维 纳 滤波 的 比较 。 

图 $.28 说 明了 了 维 纳 滤波 与 与 直接 刘波 相 比 的 优点 。 B30 ams, 27 @ 的 全 湾流 的 结果 。 类 似 地 ， 
图 5.28 (b) EKS. 27 (0) 的 半径 受 限 的 逆 滤 波 结果 。 为 便于 比较 ， 这 里 新 列 出 了 这 些 图 像 。 图 5.28(c) 显示 
了 使 用 式 (5.8-6) 通过 例 5.1 1 中 使 用 的 退化 函数 得 到 的 结果 。K 值 的 交互 式 选择 是 为 了 找到 最 好 的 视觉 效果 。 
在 这 个 例子 中 ， 与 直接 递 滤波 方法 相 比 ， 维 纳 滤波 的 效果 显然 更 好 。 比较 图 5.25(a) 和 图 5.28 (c) ， 我 们 会 
发 现 维 纳 滤波 的 结果 非常 接近 原 图 像 的 外 观 。 。 











图 5.28 ” 逆 滤 波 和 维 纳 滤 波 的 比较 : (a) E 5.25 (b) 的 全 逆 滤 波 
结果 ; (b) 半径 受 限 的 逆 滤 波 结果 ; (o) 维 纳 滤波 的 结果 


例 5.13 维 纳 泪 波 的 进一步 比较 。 
图 5.29 的 第 一 行 从 左 到 右 分 别 显示 了 被 均值 为 零 Jye 0 HR SS 26 (b) 
的 模糊 图 像 ， 直 接着 滤波 的 结果 ， 以 及 维 纳 滤 波 的 结果 。 用 式 (5.8.6) 的 维 纳 滤波 ， 通 过 例 510 的 Hu v) 
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和 交互 地 选择 天, 可 以 得 到 最 好 的 视觉 效果 。 如 所 期 望 的 那样 ， 逆 滤波 产生 了 一 幅 不 太 适 用 的 图 像 。 注意 ， 
逆 滤 波 后 的 图 像 中 的 噪声 非常 强 , 以 至 于 它 的 结构 就 在 去 模糊 滤波 器 的 方向 上 。 维 纳 滤波 的 结果 并 不 完美 ， 
但 它 的 确 给 了 我 们 一 些 关于 图 像 内 容 的 线索 。 要 辨认 图 中 的 文字 ， 还 是 有 点 难度 。 

图 5.29 的 第 二 行 显示 了 同样 的 序列 ， 但 噪声 方差 的 水 平 降低 了 一 个 数量 级 。 这 种 降低 对 逆 滤 波 没有 多 
少 影响 ， 但 维 纳 滤波 的 效果 明显 改进 了 ， 图 中 的 文字 容易 辨认 多 了 。 图 5.29 的 第 三 行 相 对 于 第 一 行 噪声 方 
差 降低 了 5 个 数量 级 。 事 实 上 , 图 5.29 (g) 中 的 图 像 已 没有 可 见 的 噪声 。 在 这 种 情况 下 ， 逆 滤波 的 结果 相当 
有 趣 。 噪 声 仍 很 明显 ， 但 是 文字 能 通过 噪声 “窗帘 ” 看见。 这 是 关于 式 (5.7-2) 的 一 个 很 好 的 例子 。 换 句 话 
说 ， 正 如 从 图 5.29(h) 中 明显 看 到 的 那样 ， 逆 滤波 消除 图 像 模糊 的 能 力 是 很 强 的 。 然 而 ,噪声 还 是 支配 
着 结果 。 即 使 我 们 能 看 到 图 5.29 (b) 和 图 5.29(e) 中 噪声 背后 的 内 容 ,但 字符 还 是 显得 有 点 模糊 ,图 5.29 (i) 
中 的 维 纳 滤波 结果 是 最 好 的 ,视觉 上 非常 接近 于 图 5.29 (a) 中 的 原 图 像 。 只 要 退化 函数 的 合理 佑 计 是 可 用 的 ， 
这 些 类 型 的 结果 就 是 使 用 维 纳 滤波 可 能 得 到 的 结果 。- 





图 5.29 (a) 由 运动 模糊 和 加 性 噪声 污染 的 8 比特 图 像 (b) 逆 滤波 的 结果 ; (c) 维 纳 滤波 的 结果 ; 
(d)~ 介 同样 的 图 像 序列 ， 但 噪声 方差 降低 了 一 个 数量 级 ; (g)~@ 同样 的 图 像 序列 ， 但 噪声 方 
差 比 图 (a) 中 的 噪声 方差 降低 了 5 个 数量 级 。 注 意图 (h) 去 模糊 图 像 透 过 噪声 “窗帘 ”清晰 可 见 


5.9 约束 最 小 二 乘 方 滤波 


关于 退化 函数 互 的 某 些 知识 必须 已 知 的 问题 ， 对 于 本 章 讨论 的 所 有 方法 很 常见 。 然 而 ， 维 纳 滤波 
却 存在 一 些 其 他 的 困难 : 未 退化 图 像 和 噪声 的 功率 谱 必 须 是 已 知 的 。 前 面 的 章节 表明 ， 使 用 式 (5.8-6) 给 
出 的 近似 方 法 能 得 到 很 好 的 结果 。 然 而 ， 功 率 谱 比 的 常数 估计 并 不 总 是 一 个 合适 的 解 。 

本 节 讨 论 的 方法 仅 要求 噪 声 方差 和 均值 的 知识 。 正 如 5.2.4 节 讨论 的 那样 ， 这 些 参数 通常 可 从 一 幅 
给 定 的 退化 图 像 计 算出 来 ， 因 此 这 是 一 个 很 重要 的 优点 。 另 一 个 不 同 是 ， 维 纳 滤波 建立 在 最 小 化 统计 
准则 的 基础 之 上 ， 因 此 在 平均 意义 上 它 是 最 优 的 。 本 节 给 出 的 算法 具有 显著 的 特点 ， 即 对 于 其 应 用 到 
的 每 幅 图 像 都 能 产生 最 优 结果 ， 当 然 ， 这 些 理论 上 满足 的 最 优 准则 与 动态 的 视觉 感知 并 没有 关系 。 因 
此 ， 算 法 的 选择 往往 由 结果 图 像 的 视觉 感 知 质量 决定 (至 少 部 分 是 这 样 的 ) 。 
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通过 使 用 式 (4.6-23) 给 出 的 卷 积 定义 ， 并 像 2.6.6 节 解 释 的 那样 ， 我 们 可 将 式 (5.5-16) 表达 为 如 下 


nei < 关于 向 量 和 矩阵 的 简要 回顾 ， 
g-Hft+n (5.9-1) ”| 请 查阅 本 书 的 网 站 。 


例如 ， 假 设 g(x,») 的 大 小 为 MxN。 然 后， 我 们 可 以 使 用 g(x, y) 的 第 一 行 中 的 图 像 元 素 构 成 向 量 g 的 第 
一 组 个 元 素 , 用 第 二 行 构成 下 一 组 个 元 素 , 以 此 类 推 。 结果 向 量 将 有 MNx 1 维 。 这 也 同样 是 f 和 
7 的 维 数 ， 因 为 这 些 向 量 是 以 同样 的 方式 构成 的 。 和 矩阵 瓦 有 MNx MN 维 ， 其 元 素 由 式 (4.6-23) 中 的 卷 
加 元 给 出 。 

把 图 像 复原 问题 简化 为 简单 的 矩阵 操作 的 结论 看 起 来 很 合理 。 遗 憾 的 是 ， 事 实 上 并 非 如 此 。 例 
如 ， 假 设 我 们 正在 处 理 一 幅 中 等 大 小 的 图 像 ， 璧 如 大 小 为 M = N = 512， 那 么 式 (5.9-1) 中 的 向 量 为 
262 144x 1 4E, AGRE WW 262 144x262 144 维 。 计 算 这 种 大 小 的 回 量 和 矩阵 并 不 是 一 件 简单 的 任务 。 
由 于 H 对 噪声 高 度 敏感 ， 因 此 问题 被 进一步 复杂 化 (在 前 面 两 节 中 我 们 已 了 解 到 噪声 的 影响 ， 因 此 对 
此 不 应 感到 奇怪 ) 。 然 而 ， 明 确 地 以 矩阵 形式 来 表达 复原 问题 确实 可 以 简化 复原 技术 的 推导 。 

尽管 我 们 不 能 完全 推导 已 存在 的 约束 最 小 二 乘法 ， 但 这 种 方法 在 矩阵 表示 法 中 的 确 有 其 根源 。 在 
本 章 的 最 后 会 给 出 参考 资料 , 涵盖 详细 推导 的 来 源 。 该 方法 的 核心 是 五 ee 
对 噪声 的 敏感 性 问题 。 减 少 噪声 敏感 性 问题 的 一 种 方法 是 以 平滑 度量 TENPE 
的 最 佳 复原 为 基础 的 ， 如 一 幅 图 像 的 二 阶 导数 (“ 拉 普 拉 斯 变换 ”这 位 |New ERABEREAN 
“ 老 朋 友 ”) 。 意味 深长 的 是 ， 必 须 用 手边 问题 的 参数 来 约束 复原 。 因 
此 ， 我们 的 期 望 是 找 一 个 最 小 准则 函数 C， 定 义 如 下 : 





M-1N-1 2 
c=) div sxy)] (5.9-2) 
x=0 y=0 
其 约束 为 
le-xF| =n? (5.9-3) 


step, Iwi ww 是 欧 几 里 得 向 量 范 数 ?，f 是 未 退化 图 像 的 估计 。 拉 普 拉 斯 算 子 V? TE (3.6-3) 中 
定义 过 。 
这 个 最 佳 化 问题 在 频率 域 中 的 解决 由 下 面 的 表达 式 给 出 : 


F(u,v) = Wane a G(u,v) (5.9-4) 
|H (u,v) +7|P(u,v)| 
式 中 ，y 是 一 个 参数 ， 必 须 对 它 进行 调整 以 满足 式 (5.9-3) 的 条 件 ，P(u, v) 是 函数 
0 -1 0 
p(x, y)=|-1 4 -1 (5.9-5) 
0 -1 0 





的 傅 里 时 变换 。 在 3.6.2 节 中 介绍 拉 普 拉 斯 算 子 时 我 们 曾 见 过 这 个 函数 。 如 早 些 时 候 注 意 到 的 那样 ， 记 
IE, p(x, y) 和 所 有 其 他 相关 的 空间 域 函 数 很 重要 ， 在 用 式 (5.9-4) 计算 其 傅 里 叶 变 换 之 前 要 用 零 进 行 
适当 的 填充 ， 正 如 4.6. 6 节 所 讨论 的 那样 。 注 意 , y 为 0 时 , 式 (5.9-4) 简化 为 逆 滤 波 。 


D 回忆 可 知 ,对 于 有 着 个 元 素 的 向 量 w, Aww Sow? , FOE w, 是 w 的 第 4 个 元 素 。 
k=l 
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例 5.14 ” 维 纳 滤波 和 最 小 二 乘 方 滤波 的 比较 。 “ 

图 5.30 显 示 了 使 用 约束 最 小 二 乘 方 滤波 处 理 图 5.29 (a) 、 15-29) 和 图 529(@ 的 结果 ， 为 P= 生 最 好 的 视 
HACR, y 的 值 是 手工 选择 的 。 使 用 同样 的 过 程 ， 产 生 的 维 纳 滤 波 结果 如 图 529(c) 、 图 5.29(f 和 图 5.29 (i) 
所 示 。 比 较 约束 最 小 二 乘 方 滤波 和 维 纳 滤波 的 结果 ;- 发 现 前 者 对 于 高 噪声 和 中 等 噪声 的 情况 ,产生 的 结 
果 要 稍 好 一 些 ， 而 对 于 低 噪声 情况 ， 两 种 滤波 产生 基本 相等 的 结果 。 当 手 工 选择 参数 以 取得 更 好 的 视觉 
效果 时 ， 约束 最 小 二 乘 方 滤波 的 效果 有 可 能 比 维 纳 滤波 的 效果 更 好 。 (5, 9-4) 中 的 参数 y 是 一 个 标量 ， 
而 式 (5.8-6) 中 的 值 是 两 个 未 知 频率 域 数 的 近似 比 ， 该 比值 很 少 是 常数。 因此 ， Lica napa 
化 图 像 的 更 为 准确 的 估计 。 





图 5.30 Alte A MEENA. 请 将 图 5.29 (c), E 5.290 和 
图 5.29 GD 所 示 的 维 纳 滤波 结果 分 别 与 图 la) 、 图 (b) 和 图 (0) 比较 


如 前 面 的 例子 所 示 ， 交 互 地 调整 参数 y 达到 可 接受 的 结果 是 可 能 的 。 然 而 ， 如 果 我 们 对 最 优化 感 
兴趣 ， 就 必须 调整 参数 y 以 满足 式 (5.9-3) 中 的 约束 条 件 。 和 迭代 计算 y 的 过 程 如 下 。 
定义 一 个 “ 残 差 ”向 量 ”为 


r=g-Hf (5.9-6) 
因为 ,由 式 (5.9-4) HOARE, Auv) ( 即 隐 含 的 广 ) 是 y 的 函数 ， 所 以 + 也 是 该 参数 的 函数 。 可 以 证 明 
(Hunt[1973]) 
oy) =r" = (5.9-7) 
JE y 的 单调 递增 函数 。 我 们 要 做 的 是 调整 y 使 得 
|r =| ta (5.9-8) 


Hp, a 是 一 个 精确 度 因 子 。 在 式 (5.9-6) 看 来 ， 如 果 |x|P =|? ， 那 么 严格 满足 式 (5.9-3) 的 约束 条 件 。 
因为 8(y) 是 单调 的 ， 所 以 寻找 满足 要 求 的 y 值 并 不 困难 。 一 种 方法 是 

1. 指定 y 的 一 个 初始 值 。 

2. 计算 Ir 。 

3. 车 满足 式 (5.9-8) ， 则 停止 ;否则 ,车 lr 上 <|w| — a, WAY, Hl? > f+ a， 则 减 小 y 

然后 返回 步骤 2。 使 用 yy 的 新 值 ， 通 过 式 (5.9-4) 重 新 计算 最 佳 估计 六 (u,v) o 
其 他 的 方法 ， 璧 如 牛顿 - 拉 弗 森 算法 ， 也 可 用 于 改进 收敛 的 速度 。 
为 了 使 用 这 一 算法 ,我们 需要 | Al? 的 值 。 为 了 计算 x ， 由 式 (5.9-6) 得 


R(u,v) = G(u,v)— H (u,v) F (u,v) (5.9-9) 
由 此 ， 我 们 可 以 通过 计算 Riu, v) 的 傅 里 叶 反 变换 得 到 r(x, y)。 然 后 有 
381 M-1N-1 
z lr = p3 =. r? (x,y) (5.9-10) 


82 x=0 y=0 
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计算 |w| 可 以 得 出 一 个 重要 的 结果 。 首 先 ， 考 虑 整 幅 图 像 上 的 噪声 方差 ， 该 方差 可 以 使 用 取样 平均 的 
方法 来 估计 ， 如 3.3.4 节 讨 论 的 那样 : 


让 l we 2 ( ) 
Co, =e n(x, y)—™m,, 5.9-11 
i MN x=0 2l | 
式 中 ， 
M-\1N-1 
yy e, y) (5.9-12) 
x=0 y=0 


是 样本 均值 。 参 考 式 (5.9-10) 的 形式 ， 我 们 注意 到 式 (5.9-11) 中 的 双重 求 和 等 于 |w| 。 这 就 给 出 了 如 下 

ln = MN | o} +m? | (5.9-13) 
这 是 非常 有 用 的 结果 。 它 告诉 我 们 , 仅 用 噪声 均值 和 方差 的 知识 , 我 们 就 可 以 实现 一 个 最 佳 复 原 算法 。 
这 些 值 并 不 难 估计 ( 见 5.2.4 节 ) ,但 要 假设 噪声 和 图 像 灰 度 值 不 相关 。 这 是 本 章 讨论 的 所 有 方法 的 一 个 
基本 假设 


例 5.15 最 佳 约束 最 小 二 乘 方 滤波 的 迭代 估计 。 | 

图 5.31 (a) 显示 了 使 用 刚才 描述 的 算法 来 估计 用 于 复原 图 5.25 (b) 的 最 佳 滤波 得 到 的 结果 。y 的 初始 值 
是 10”， 调整 y 的 校正 因子 是 10*,a 的 值 为 0.25。 用 于 生成 图 5.25 (a) 的 指定 噪声 参数 相同 : 噪声 方差 为 
105， 均 值 为 0。 复 原 结果 几乎 与 图 5.28 (c) 一样 好 ， 图 5.28(6) 是 由 维 纳 滤波 得 到 的 结果 ， 为 得 到 最 好 的 视 
KAR, FETRET K 值 。 图 5.31(b) 显示 了 使 用 噪声 参数 的 错误 估计 值 时 发 生 的 情况 。 在 这 种 情况 下 ， 
指定 的 噪声 方差 为 102， 并 且 均 值 保 留 为 0。 在 这 种 情况 下 ， 结 果 有 相当 大 的 模糊 。 





图 5.31 (a) 对 图 5.16(b) (EMR SE EEA \ 二 乘 方 复原 ; (b) 使 用 错误 的 噪声 参数 得 到 的 结果 
正如 本 节 开 始 指出 的 那样 ， 约 束 最 小 二 乘 方 意义 下 的 最 佳 复原 在 视觉 效果 上 并 不 意味 着 最 好 。 根 

据 退 化 和 噪声 的 性 质 及 大 小 ， 算 法 中 交互 确定 最 佳 估计 的 其 他 参数 ， 在 最 终结 果 中 也 起 着 很 重要 的 作 

用 。 通 常 ， 自 动 确定 的 复原 滤波 器 比 人 为 调整 滤波 器 参数 的 复原 结果 要 差 。 特 别 是 约束 最 小 二 乘 方 滤 

波 器 完全 由 单一 的 标量 参数 来 决定 时 更 是 如 此 。 

5.10 几何 均值 滤波 


我 们 可 对 5.8 节 中 讨论 的 维 纳 滤波 器 稍 加 推广 。 这 种 推广 就 是 所 谓 的 几何 均值 滤波 融 的 形式 : 
* a * l-a 
Ê(u,v) 人 <4 et en (5.10-1) 
|H (u,v)| |H (u, v? Te 7 (Us >] 
S; (u,v) 


式 中 ，x 和 是正 的 实 常数 。 几 何 均值 滤波 器 由 两 个 括号 内 的 寡 次 分 别 为 和 1-a 的 表达 式 组 成 。 








382 


383 
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当 x=1 时 ， 该 滤波 器 退化 为 着 滤波 器 ; 当 wx= 0 时 ， 该 滤波 器 变 为 所 谓 的 参数 维 纳 滤 波 器 ， 参 数 
ARNE BEATE B= 1 时 还 原 为 标准 的 维 纳 滤波 器 。 如果 = 1/2, 则 滤波 器 变 成 相同 宕 次 的 两 个 量 的 积 ， 
这 是 几何 均值 的 定义 , 这 样 就 给 出 了 这 种 滤波 器 的 命名 。 当 p= 1 时, 随 着 a 减 小 到 1/2 以 下 ,滤波 器 
的 性 能 越 来 越 接 近 逆 滤 波 器 。 类 似 地 ， 当 < 增 大 到 12 以 上 时 ， 滤 波 器 更 接近 维 纳 滤波 器 。 当 w = 1/2 
且 B=1 时 ， 该 滤波 天 通常 也 称 为 谱 均 衡 滤波 器 。 式 (5.10-1) 在 实现 复原 滤波 时 非常 有 用 ， 因 为 它 表示 
了 合并 为 单个 表达 式 的 滤波 器 族 。 


5.11 由 投影 重建 图 像 


在 本 章 的 前 几 节 中 , 我 们 讨论 了 各 种 复原 退化 图 像 的 技术 。 本 节 研 究 由 一 系列 投影 重建 一 
幅 图 像 的 问题 , 集中 讨论 X 射线 计算 机 断层 (CT) 。 这 是 最 早 且 应 如 第 1 章 注 释 的 那样 ,通常 也 用 术 | 
用 最 广泛 的 CT 类 型 ， 也 是 当前 数字 图 像 处 理 在 医学 中 的 主要 应 “| 语 计算 机 轴 向 断层 术 (CAT) 来 表示 
用 之 一 。 ee 


5.11.1 引言 


重建 问题 在 原理 上 很 简单 ， 并且 可 以 直接 用 直观 的 定性 方法 加 以 描述 。 首 先 ， 考虑 图 5.32(a) , E 
由 均匀 背景 上 的 单一 物体 组 成 。 它 的 物理 意义 可 解释 如 下 : 假设 该 图 像 是 人 体 三 维 区 域 的 一 个 横断 面 。 
还 假设 图 像 中 的 背景 表示 均匀 的 软组织 ， 它 所 环绕 的 物体 是 一 个 肿瘤 ， 该 肿瘤 也 是 均匀 的 ， 但 有 较 高 
的 吸收 特性 。 

RE, 如 图 5.32 (a) 所 示 , 假设 我 们 用 一 束 细 的 、 平 行 的 X 射线 从 左 到 右 扫 描 ( 通 过 图 像 平 面 ) ,并 
且 假 设 物体 吸收 的 射线 束 能 量 比 背景 吸收 的 射线 束 能 量 多 ， 这 是 典型 的 情况 。 利 用 放 在 该 区 域 男 一 端 
的 X 射线 吸收 检测 器 带 将 产生 所 示 的 信号 (吸收 断面 图 ) 。 该 信号 的 幅度 (亮度) 与 吸收 成 正比 "。 我 们 
能 够 观察 到 信和 号 中 的 任意 一 点 都 是 穿 过 相应 空间 点 的 该 射线 束 中 单一 射线 吸收 值 的 和 (这 样 的 和 通常 
称 为 射线 和 ) 。 这 时 ， 有 关 物 体 的 所 有 信息 就 是 这 个 一 维 的 吸收 信号 。 

由 单个 投影 ， 我 们 无 法 确定 沿 射线 路 径 处 理 的 是 单个 物体 还 是 多 个 物体 ， 但 我 们 可 以 仅 基于 这 一 
言 息 来 创造 一 幅 图 像 的 方法 开始 重建 。 如 图 5.32 (b) 所 示 , 该 方法 是 沿 着 射线 来 的 方向 把 一 维 信号 反 投 
影 回去 。 穿 过 二 维 区 域 的 一 维 信号 的 反 投影 过 程 ， 有 时 可 想象 为 把 投影 穿 过 该 区 域 反 “涂抹 ”回去 。 
在 数字 图 像 中 ,这 意味 着 沿 垂直 于 射线 方向 复制 横 穿 图 像 的 相同 一 维 信号 。 例 如 ， 图 5.32 (b) 就 是 由 复 
制 矩 形 图 像 的 所 有 列 中 的 一 维 信号 创建 的 。 显然， 刚刚 描述 的 方法 就 称 为 反 投 影 法。 

接着 ， 假 设 我 们 把 源 -检测 器 对 的 位 置 旋转 90"， 如 图 5.32 (c) 所 示 。 重 复 前 段 解释 的 步骤 ， 在 垂直 
方向 生成 一 幅 反 投影 图 像 , 如 图 5.32 (d) 所 示 。 我 们 把 这 一 结果 加 到 前 面 的 反 投 影 图 像 上 继续 重建 工作 ， 
结果 如 图 5.32 (e) 所 示 。 现 在 ,我 们 可 以 说 我 们 感 兴趣 的 物体 已 包含 在 所 示 的 方形 中 ， 其 幅度 是 单个 投 
影 幅 度 的 两 倍 。 稍 加 思考 后 ， 就 会 了 解 使 用 刚刚 讨论 的 方法 得 到 更 多 的 视图 ， 我 们 应 能 得 到 关于 物体 
形状 的 更 多 信息 。 事 实 上 ， 如 图 5.33 所 示 ， 所 发 生 的 情况 说 明 这 是 正确 的 。 随 着 投影 数量 的 增加 ， 不 
相交 反 投影 的 强度 相对 于 多 个 反 投影 相交 区 域 的 强度 会 降低 。 最 终结 果 是 ， 较 亮 区 域 将 支配 结果 ， 当 
为 显示 而 调节 亮度 时 ， 很 少 相 交 或 不 相交 的 反 投影 将 减弱 为 背景 。 

由 32 个 投影 形成 的 图 5.33 (说 明了 这 一 概念 。 但 要 注意 ， 尽 管 这 幅 重 建 的 图 像 是 对 原始 物体 
形状 的 较 好 近似 ,但 它 却 被 “ 坚 环 ”效应 所 模糊 ， 关 于 该 信息 可 在 图 5.33 中 的 渐进 步骤 中 看 到 。 例 





D 关于 XX 射线 源 和 检测 器 的 物理 知识 超出 了 我 们 探讨 的 范围 ,我 们 的 讨论 主要 是 CT 的 图 像 处 理 。 关 于 X 射线 图 像 形成 的 物理 原 
理 ， 请 参阅 Prince and Links[2006]. 
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如 ， 图 5.33 (e) 中 的 “学 环 ”以 星 状 形式 出 现 ， 其 亮度 比 物体 低 ， 但 又 比 背 景 高 。 当 视图 数量 增加 时 ， 
“学 环 ” 的 形状 变 成 _ -个 圆 ， 如 图 5.33 (人 所 示 。 在 CT 重建 中 ， 模 糊 是 一 个 重要 问题 ， 其 解决 办 法 将 
在 5.11.5 节 讨 论 。 最 后 ， 从 图 5.32 和 图 5.33 的 讨论 ， 我 们 得 出 结论 : 相隔 180° 的 投影 互 为 镜像 图 像 ， 
因此 ， 为 了 产生 重建 所 要 求 的 所 有 投影 我 们 只 要 按 圆周 的 一 半角 度 增 量 来 考虑 即 可 。 


Bee Hl i 7 





a b 
cde 











15.32 (a) 显示 S AA eee 一 个 输入 的 平行 射线 束 ， 一 个 检测 器 带 ; (b) 感 
3 条 带 数 据 反 投 影 的 结果 ( 即 一 维 吸收 前 面 ) ; (c) 旋转 90° 后 的 射线 束 和 检 ak 
d) 反 投影 ; (ec) A (b) ANA (d) 的 和 。 反 投影 相交 处 的 亮度 是 各 个 反 投影 的 亮度 的 两 倍 


图 $5.33 (a) 与 图 5.32 (a) 相同 的 图 像 ，(b)~(e) 使 用 间隔 为 45° 的 1、2、3、4 个 
反 投影 的 重建 ; (用 间隔 5.625° 的 32 个 反 投影 的 重建 ( 注意 模糊 效果 ) 


例 5.16 包含 两 个 物体 的 简单 平面 的 反 投影 。 

图 5.34 说 明了 稍微 复杂 一 些 的 区 域 的 反 投 影 法 重建 ， 该 区 域 包含 两 个 具有 不 同 吸 收 特性 的 物体 。 
图 5.34(b) 显示 了 用 一 个 反 投 影 的 结果 。 我 们 注意 到 该 图 的 三 个 主要 特性 ， 从 下 到 上 : 一 个 细 的 水 平 灰色 带 
与 小 物体 还 不 能 最 后 断定 的 部 分 相对 应 ; 在 它 上 边 较 亮 的 条 带 ( 吸 收 更 多 ) 对 应 于 由 两 个 物体 共享 的 区 域 ; 
以 及 对 应 于 椭圆 物体 剩余 部 分 的 上 边 的 条 带 。 图 5.34(c) 和 图 5.34 (d) 分 别 显示 了 使 用 相隔 90° 的 两 个 投 


abc 
def 
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影 和 相隔 45°H 4 个 投影 的 重建 结果 。 这 些 图 形 的 解释 类 似 于 对 图 5.33 (c) 到 图 5.33 (e) 的 讨论 。 图 5.34(e) 
和 (人 显示 了 分 别 使 用 32 个 和 64 个 反 投影 的 更 精确 重建 结果 。 这 两 个 结果 在 视觉 上 非常 接近 , 而 且 两 者 都 
显示 了 之 前 提 到 的 模糊 问题 ， 模 糊 问 题 的 解决 办 法 将 在 5.11.5 节 中 讨论 。 


abc 

def 

图 5.34 (a) 有 两 个 物体 的 区 域 ; (b)~(d) 用 相隔 90°H 1, 2 和 相隔 45° 的 4 个 反 投 影 的 重建 ; 
(e) 用 相隔 5.625° 的 32 个 反 投 影 的 重建 ; 人 也 用 相隔 2.8125° 的 64 个 反 投 影 的 重建 


5.11.2 计算 机 断层 (CT) 原 理 


X 射线 计算 机 断层 的 目的 是 使 用 X 射线 从 许多 不 同 的 方向 穿 过 物体 , 进而 得 到 该 物体 内 部 结构 的 
三 维 描述 。 传 统 的 胸部 X 射线 透视 是 把 物体 放 在 对 X 射线 敏感 的 平板 对 面 ， 并 用 圆锥 形 X 射线 束 照 
射 这 个 体 得 到 的 。X 射线 平板 产生 一 幅 图 像 ， 该 图 像 上 一 个 点 的 亮度 与 X 射线 通过 该 物体 后 照射 到 该 
点 上 的 X 射线 能 量 成 正比 。 这 幅 图 像 就 是 在 前 节 中 讨论 过 的 投影 的 二 维 图 像 。 我 们 可 以 对 整 幅 图 像 进 
行 反 投 影 ， 并 创建 一 个 三 维 物体 。 通 过 在 多 个 角度 重复 该 过 程 ， 并 把 反 投影 相 加 ， 就 可 产生 胸腔 结构 
的 三 维 再 现 。 计 算 机 断层 通过 身体 产生 的 切片 试图 得 到 相同 的 信息 (或 其 局 部 ) 。 三 维 描述 可 以 通过 堆 
积 这 些 切片 得 到 。CT 的 实现 要 经 济 得 多 ， 因 为 得 到 高 分 辨 率 切 片 所 需 的 检测 需 数 量 , 要 比 产生 相同 分 
辩 率 的 一 个 完整 二 维 投影 所 需 的 检测 器 数量 少 得 多 。 计 算 负担 和 和 射线 的 剂量 同样 要 降低 ， 这 样 才能 
使 一 维 投影 CT 成 为 一 种 更 实际 的 方法 。 

如 上 一 章 中 讨论 傅 里 时 变换 时 那样 ,CT 所 要 求 的 基本 数学 概念 在 数字 计算 机 能 够 实用 之 前 已 
存在 很 多 年 。CT 的 理论 基础 可 追溯 至 来 自 维 也 纳 的 数学 家 约翰 雷 登 ， 作 为 其 线 积 分 工作 的 一 部 
分 , 他 于 1917 年 推导 了 一 种 沿 平行 射线 对 一 个 二 维 物体 投影 的 方法 。 今 天 ， 该 方法 就 是 通 稼 所 指 
的 雷 登 变换 ， 这 是 下 一 节 讨 论 的 主题 。45 年 后 , 埃 兰 * M: 考 玛 克 (Allan M. Cormack) ERIK 
大 学 的 物理 学 者 部 分 地 重新 发 现 了 这 些 概 念 ， 并 把 它们 应 用 到 CT 上 。 考 玛 克 在 1963 年 和 1964 
年 发 表 了 他 的 最 初 发 现 ， 并 且说 明了 如 何 从 不 同 角度 得 到 的 X 射线 图 像 重建 人 体 横 截面 图 像 。 他 
给 出 了 重建 所 需要 的 数学 公式 , 并 且 构 建 了 一 个 用 于 展示 其 概念 的 实际 CT 原型 。 同时 , 伦敦 EMI 
公司 的 电子 工程 师 高 德 弗 里 . Ns 豪 斯 菲尔德 (Godfrey N. Hounsfield) 及 其 同事 也 独立 给 出 了 类 似 
的 解决 方法 , 并 建立 了 第 一 台 医 学 CT 机 。 由 于 他 们 对 医学 断层 的 贡献 , 考 玛 克 和 豪 斯 非 尔 德 共 同 
获得 了 1979 年 的 诺 贝 尔 医学 奖 。 

第 一 代 (G1) CT 扫描 仪 采 用 “铅笔 ”型 X 射 线束 和 单个 检测 右 ， 如 图 5.35 (a) 所 示 。 对 于 一 个 
给 定 的 旋转 角度 ， 源 -检测 器 对 沿 着 所 示 的 线性 方向 增 量 式 地 平移 。 投 影 (类 似 于 图 5.32) 由 测量 每 

PS 个 增 量 平移 处 检测 器 的 输出 产生 。 完 成 线性 平移 之 后 ， 旋 转 源 -检测 器 组 合 ， 并 重复 该 过 程 得 到 不 
888| 同 角 度 上 的 男 一 个 投影 。 该 过 程 在 0 到 180°? 内 对 所 有 期 望 的 角度 重复 ， 生 成 一 组 完整 的 投影 ， 就 
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像 前 一 节 解 释 的 那样 , 用 反 投 影 产生 一 幅 图 像 。 物 体 项 部 的 十 字 标 记 表 明 与 源 -检测 器 对 构成 的 平面 相 
垂直 的 方向 的 运动 。 增 量 式 地 将 物体 移 过 源 - 检 测 器 平面 每 完成 一 次 扫描 后 ) , 产生 一 组 横 截 面 图像 ( 切 
片 )。 堆 积 这 些 图 像 就 可 生成 人 体 截面 的 三 维 体 。 医 学 成 像 的 第 一 代 扫 描 仪 不 久 就 不 再 生产 ,但 由 于 它们 
可 产生 平行 的 射线 束 (如 图 5.32 所 示 ) ,它们 的 几何 学 原理 作为 介绍 CT 成 像 的 基础 是 有 优势 的 。 正如 下 一 
节 要 讨论 的 那样 ， 该 几何 学 原理 是 推导 由 投影 实现 图 像 重建 所 需 公式 的 起 点 。 
ab 源 oe 
Gi 


d 7 | ele = =) 











示 垂 直 于 纸 面 的 线性 运动 。 图 (a) 和 图 (b) 中 的 双 箭 头 表示 源 /检测 器 单元 被 平移 后 又 回 到 了 其 原始 位 置 


第 二 代 (G2) CT 扫描 器 [ 见 图 5.35 (b) ] 与 第 一 代 扫 描 器 的 工作 原理 相同 , 但 所 用 射线 束 是 扇形 的 。 
这 就 允许 使 用 多 个 检测 器 ， 因 而 源 -检测 器 对 的 平移 较 少 。 第 三 代 (G3) 扫描 器 较 前 两 代 CT 在 几何 
原理 上 有 较 大 的 改进 。 如 图 5.35(c) 所 示 ，G3 扫描 器 使 用 足够 长 的 一 族 检测 器 ( 约 有 1000 个 独立 
的 检测 需 ) 来 覆盖 一 个 更 宽 射 线束 的 整个 视野 。 因 此 ， 每 个 角度 的 增 量 都 会 产生 一 个 完整 的 投影 ， 
从 而 消除 了 如 G1 和 G2 扫描 器 那样 对 源 -检测 器 对 的 平移 的 需求 。 第 四 代 (G4) 扫 描 器 更 进一步 。 
它 使 用 一 个 圆 环 检测 器 ( 约 有 5000 个 独立 的 检测 器 ) , 仅 射线 源 旋转 。G3 和 G4 扫描 器 的 重要 优点 
是 速度 快 , 主要 缺点 是 造价 高 和 较 大 的 X 射线 散射 , 它 需 要 比 G1 和 G2 扫描 器 更 高 的 剂量 才能 达 
到 可 比拟 的 信 噪 比特 性 。 

新 的 扫描 模式 正在 开始 使 用 ,例如 ,第 五 代 (G5) CT 扫描 器 , 即 所 知道 的 电子 束 计算 机 断层 (EBCT) 
扫描 器 ， 取 消 了 所 有 的 机 械 运动 ， 而 改 为 以 电磁 方式 来 控制 电子 束 。 通 过 触发 环绕 病人 的 钨 极 板 ， 这 
些 电子 束 产 生 X 射线 ,然后 和 射线 被 整形 为 通过 病人 的 扇形 射线 束 ， 并 激发 如 G4 扫描 器 那样 的 检测 
器 环 。 

传统 方法 得 到 的 CT 图 像 在 扫描 期 间 要 求 病 人 保持 不 动 才 能 生成 图 像 。 然 后 ， 病 人 在 垂直 于 成 P 
像 平 面 上 用 机 动工 作 台 递增 移动 位 置 时 ， 停 止 扫 描 。 再 后 ， 得 到 下 一 幅 图 像 ， 重复 该 过 程 多 次 ， 直 B89 
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到 覆盖 人 体 某 个 特定 的 截面 所 要 求 的 数量 为 止 。 虽然 不 到 一 秒 就 可 得 到 一 幅 图 像 ， 但 在 图 像 获 取 期 间 
要 求 病人 据 住 呼吸 (如 腹部 和 胸部 扫描 ) 。 完成 30 幅 图 像 的 采集 过 程 可 能 需要 几 分 钟 时 间 。 针 对 该 问题 
所 用 的 一 种 方法 是 螺旋 CT， 有 时 也 称 为 第 六 代 (G6) CT。 在 该 方法 中 ，G3 和 G4 扫描 器 使 用 一 种 所 谓 
的 滑动 环 来 配置 ， 它 不 需要 源 -检测 器 和 处 理 单元 之 间 的 电气 和 信和 号 连接 。 然 后 ， 源 -检测 器 对 连续 旋 
转 360"， 同 时 病人 在 垂直 于 扫描 的 方向 恒 速 移动 。 结 果 是 连续 的 螺旋 数值 ， 这 些 数据 经 处 理 后 就 可 得 
到 各 幅 切片 图 像 。 

第 七 代 \G7) 扫描 器 (也 称 为 多 切片 CT 扫描 器 ) 即 将 问世 ， 这 种 扫描 器 组 合 使 用 “ 厚 ” 扇 形 射线 束 
和 平行 检测 器 族 ， 同 时 收集 体 CT 数据 ， 即 三 维 模 截 “ 厚 片 层 ", 而 不 是 每 个 X 射线 脉冲 产生 单个 横 截 
面 图像 。 除 了 有 效 地 增加 了 细节 之 外 ， 这 种 方法 的 优点 是 它 使 用 的 XX 射 线 管 更 经 济 ， 因 此 降低 了 成 本 
和 剂量 。 

在 下 一 节 开 始 ， 为 系统 阐述 图 像 投 影 ， 我 们 将 推导 一 些 必要 的 数学 工具 和 重建 算法 。 我 们 的 关注 
点 是 图 像 处 理 的 基本 原理 ， 它 是 我 们 刚刚 讨论 过 的 所 有 CT 方法 的 基础 。 与 CT 系统 有 关 的 机 械 和 源 - 
检测 器 特性 相关 的 信息 ， 将 在 本 章 末 尾 引 用 的 参考 文献 中 提供 。 


在 这 一 节 中 , 我 们 遵从 CT 约定 并 将 
5.11.3 ”投影 和 雷 登 变换 y 平面 的 原点 放 在 中 心 位 置 而 不 是 之 


前 惯用 的 左上 和 角 位 置 ( 见 2.4.2 节 )。 但 
下 面 详 细 推导 根据 X 射线 计算 机 断层 重建 图 像 所 需 的 数学 公式 ， | 请 注意 , 这 两 种 坐标 系 均 是 右手 坐标 


相同 的 基本 原理 也 适用 于 其 他 CT 成 像 模 式 , 如 SPECT ( 单 电 子 发 射 断 ee a. 
层 ) 、PET( 正 电子 发 射 断层 ) 、MRI( 核 磁 共 振 成 像 ) 和 超声 成 像 的 某 些 们 就 可 发 现 这 种 不 同 ， 因 此 两 种 表示 
模式 。 是 可 互 换 的 。 

在 笛 卡 儿 和 坐标 系 中 ， 一 条 直线 可 以 完全 由 其 斜 币 式 >= ax +b KHDR, 
或 可 由 其 法 线 表 示 来 描述 ， 如 图 5.36 所 示 : 

x cosô +y sinf =p (5.11-1) 

平行 射线 束 的 投影 可 由 一 组 直线 建 模 ;， 如 图 5.37 所 示 。 投 影 信 号 中 的 任意 一 点 由 沿 直线 
xcos6, + ysin, = p; 的 射线 和 给 出 。 工 作 在 连续 变量 情况 下 时 ， 线 求 和 变 为 线 积 分 "， 由 下 式 给 出 : 





E(P O) = E T ræsa cos@ + y sind, — p;) dx dy (5.11-2) 


式 中 , 我 们 使 用 了 4.5.1 节 中 讨论 的 冲 激 函数 5 的 性 质 。 换 名 话说 , 除非 5 的 参量 是 零 , 否则 式 (5.11-2) 
的 右边 为 零 ， 它 指出 积分 只 沿线 xcosbs + ysind, = p 计算 。 如 果 考 虑 2 Ma 的 所 有 值 ， 那 么 前 一 公 
式 推广 为 


gs(p,0)=| < | My f(x, y)5(x cosO + y sind - p) dx dy (5.11-3) 


给 出 沿 xy 平面 中 任意 一 条 线 的 f(x,y) 的 投影 ( 线 积分 ) 的 公式 ， 就 是 前 一 节 提 到 的 雷 登 变换 。 符 号 
Rf (x, YY RRL} 有 时 用 于 代替 式 (5.11-3) PHI gCo, 9) 来 表示 f 的 雷 登 变换 , 但 式 (5.11-3) 中 所 用 的 
符号 类 型 更 为 常见 。 随 后 的 讨论 更 明显 ， 雷 登 变换 是 投影 重建 的 基石 ， 计 算 机 断层 是 其 在 图 像 处 理 领 
域 的 主要 应 用 。 


D 在 第 4 章 中 , 我 们 使 用 (4 z) 来 表示 连续 图 像 坐标 ， 而 用 x,y) 来 表示 离散 坐标 。 当 时 ,这 种 区 别 很 重要 ， 因 为 我 们 在 推导 从 连续 
到 取样 后 的 量 的 基本 概念 。 在 当前 的 讨论 中 ， 由 于 我 们 会 在 连续 与 离散 坐标 之 间 多 次 往返 ， 坚 持 这 种 约定 很 可 能 会 导致 不 必要 
的 混淆 。 因 此 ， 为 遵从 已 出 版 文献 中 的 约定 ( 见 Prince and Links[2006]) ， 我 们 会 根据 上 下 文 来 确定 坐标 (x, y) 是 连续 的 还 是 离散 
的 。 当 坐标 是 连续 坐标 时 ， 我 们 会 看 到 积分 ， 而 坐标 为 离散 坐标 时 ， 会 看 到 求 和 。 
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FER ep. 0.) S vt 
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投影 中 的 一 个 点 
8( pj x) 





图 5.36 直线 的 法 线 表 示 ” ”图 5.37 平行 射线 束 的 几何 描述 
在 离散 情况 下 ， 式 (5.11-3) 变 成 
= M-1N-1 
g(p;0)= 》 > f(x, y)d(x cosO + y sind - p) (5.11-4) 
5 x=0 y=0 


式 中 ，x, yp,0 现在 是 离散 变量 。 如 果 固 定 9 而 令 p 变化 我 们 可 以 看 到 ， 式 (5.11-4) 简化 为 沿 着 由 
这 两 个 参数 的 特定 值 定义 的 线 对 f(x,y) 的 像素 求 和 。( 固 定 9 值 的 情况 下 ) 通 过 增加 覆盖 图 像 (9 值 固 
定 ) 所 要 求 的 p 的 所 有 值 产生 一 个 投影 。 改 变 0 并 重复 前 述 过 程 则 产生 另 一 个 投影 ， 以 此 类 推 。 这 正 
好 就 是 5.11.1 节 中 生成 投影 的 方法 。 De 
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图 5.38 ” (a) 一 个 圆 盘 ; (b) 该 圆 盘 解析 推导 的 雷 
登 变换 的 曲线 。 这 里 我 们 可 以 画 出 该 变 
当 g 取 


换 ， 因 为 它 仅 取决 于 


一 个 变量 ， 


决 于 D 和 0 时 ， 雷 登 变 
像 ， 其 坐标 轴 是 P 和 6 , 


变换 变 成 一 幅 图 
而 一 个 像素 


的 亮度 与 该 像素 位 置 处 的 g 值 成 正比 


当 雷 登 变 换 2(p,0) 以 p 和 0 作为 直线 坐标 显示 为 
一 幅 图 像 时 , 结果 称 之 为 正弦 图 (sinogram) , 概念 上 类 似 
于 所 显示 的 传 里 叶 谱 【但 与 傅 里 叶 变换 不 同 的 是 ， 
g(p,9) 总 是 一 个 实 函 数 ]。 类 似 于 傅 里 叶 变换 ,正弦 图 包 
HE f (x, y) 所 需 的 数据 。 EERTE T, 
ESTARA eae, E] 
容易 解释 , 但 作为 一 个 变 | 图 中 jp 轴 的 最 小 维 对 应 于 投影 期 间 | 
得 很 复杂 的 投影 区 域 去 “| 遇 到 的 最 大 维 。 例 如 , 使 用 lo 增 量 得 | 


Saas pane bei | 到 的 大 小 为 M x ie 3% 
“S AMRA 

Aiye 难 。 | 的 最 小 尺 二 为 180 x 0, 其 中 大 于 | 
例如 ,图 539(b) 是 左 侧 | | EM 的 最 小 下 数 | 


矩形 的 正 蓄 图 , 其 垂直 轴 | 一 一 | 
和 水 平 轴 分 别 对 应 于 p 和 0 。 因 此 ， 底 部 一 行 是 矩形 在 
水 平方 向 上 的 投影 ( 即 9 = 0。 ， 中 间 一 行 是 在 垂直 方向 
上 的 投影 ( 即 9 = 90°) 。 底 部 一 行 的 非 零 部 分 比 中 间 一 行 
的 非 零 部 分 小 这 一 事实 告诉 我 们 , 物体 在 水 平方 向 较 罕 。 
正弦 图 在 两 个 方向 上 关于 图 像 中 心 对 称 的 事实 告诉 我 
们 ， 处理 的 物体 是 对 称 的 ， 并且 平 行 于 x 轴 和 yy 轴 。 最 
后 ， 正 弦 图 是 平滑 的 ， 这 表明 物体 具有 均匀 的 灰 度 。 除 
了 这 些 类 型 的 一 般 观察 外 ， 关 于 正弦 图 我 们 说 不 出 更 多 
的 特点 。 





图 $.39(c) 显示 了 一 幅 Shepp-Logan 幻影 图 像 ， 该 图 像 是 广泛 使 用 的 合成 图 像 ， 设 计 用 于 模拟 脑 部 


主要 区 域 的 吸收 情况 ， 包 括 几 个 小 肿瘤 。 


如 图 $.39(d) 所 示 , 解释 这 幅 图 像 的 正弦 图 更 加 困难 。 我 们 仍 


然 可 以 推断 某 些 对 称 的 特点 ， 但 这 是 我 们 能 够 说 明 的 全 部 内 容 。 正 弦 图 的 视觉 分 析 仅 限 于 实际 应 用 ， 
但 有 时 对 于 开发 算法 是 有 帮助 的 。 








图 5.39 两 幅 图 像 和 它们 的 正弦 图 ( 雷 


为 Shepp-Logan 幻影 


在 其 原 妇 


登 变 
IER 
H 


变换 ) 。 
形式 中 ， 


180 


9 90 


8 90 








cee 行 是 在 垂直 轴 上 沿 相应 角度 的 投影 。 图 像 cc) 称 
影 的 灰 度 非常 低 。 为 便于 观察 ， 这 里 显示 的 是 增强 后 的 图 像 
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CT 的 关键 目的 是 从 投影 得 到 物体 的 三 维 表 示 。 如 5.11.1 节 直 观 介绍 的 那样 , 其 方法 是 反 投影 每 
个 投影 ， 然 后 对 反 投 影 求 和 来 产生 一 幅 图 像 (切片 ) 。 堆 积 所 有 的 结果 图 像 后 ， 再 现 三 维 物体 。 为 了 
得 到 来 自 雷 登 变 换 的 反 投影 图 像 的 形式 化 表达 ,让 我 们 从 单 点 开始 ，g(p;,0. ) 是 全 部 投影 g(p,8.) 的 
一 个 固定 旋转 值 0, 的 投影 ( 见 图 5.37) 。 由 这 个 单 点 的 反 投影 形成 的 一 幅 图 像 的 部 分 与 将 线 L(p,,0. ) 复 
制 到 图 像 上 相 比 , 并 不 能 提供 更 多 的 信息 , 其 中 线 上 每 一 点 的 值 是 g(p;,6,) 。 对 投影 信号 中 的 所 有 p, 值 
重复 这 一 过 程 (保持 @ 值 固定 为 2 ) ， 可 得 到 如 下 表达 式 : 
fo, (%Y) = (7,4) = g(x cos 8, + ysin A ,O,) 


对 固定 角度 6, 投影 进行 反 投 影 所 得 到 的 图 像 见 图 5.32(b) 。 这 一 公式 对 于 任意 0 值 均 成 立 ， 因 此 我 们 
一 般 可 以 把 由 角度 6 处 得 到 的 单个 反 投影 形成 的 图 像 写 为 


folx,y)= g(x cos + y sind, 8) (5.11-5) 
通过 对 所 有 的 反 投影 图 像 积分 ， 我 们 得 到 最 终 图 像 : 


fx, y=]; folx, ydo (5.11-6) 
在 离散 情况 下 ， 积 分 变 成 对 所 有 反 投影 图 像 求 和 ; 


SENE 2 foley) (5.11-7) 


sth, x, 7 和 6 现在 是 离散 值 。 回 顾 $.11.1 节 中 的 讨论 ， 在 09 和 180° 处 的 投影 互 为 镜像 图 像 ， 因 此 求 
和 执行 最 后 的 角度 增 量 在 180* 之 前 。 例 如 ， 如 果 使 用 0.5° 的 增 量 ， 则 求 和 操作 是 从 0° 到 179.5° 以 半 度 
为 增 量 。 用 刚刚 讨论 的 方法 形成 的 反 投 影 图 像 有 时 称 为 层 图 (laminogram) 。 我 们 可 以 隐 含 地 将 层 图 理 
解 为 仅 是 对 产生 投影 的 图 像 的 一 个 近似 ， 下 面 的 例子 将 清楚 地 解释 这 一 事实 。 


例 5.18 pie. | Socata A 

3K (5.11-7) 用 于 从 式 的 投影 产生 图 532 下 
到 图 5.34 的 反 投影 图 像 。 类 人 些 公式 用 于 产生 
图 5.40(a) 和 图 5.40(b) , 它们 分 别 显示 了 对 应 于 图 539(b) Z 
和 图 5.39 (d) 中 正弦 图 的 反 投影 图 像 。 如 之 前 的 图 像 屠 ie 
FE, 我 们 注意 到 出 现 了 很 严重 的 模糊 现象 , 因此 很 明显 ， 
直接 运用 式 (5.11-4) 和 式 (5.11-7) 将 得 到 不 可 接受 的 结 
SR, 然而,， 如 5.11.5 节 中 介绍 的 那样 ， 采 用 重新 表达 反 
投影 的 方法 ， 有 可 能 改善 重建 的 效果 。 


5.11.4” 傅 里 叶 切 片 定理 


本 节 推 导 与 投影 的 一 维 依 里 叶 变 换 和 得 到 投影 区 域 的 二 维 傅 里 叶 变 换 相关 的 基本 结果 。 这 一 关系 
是 能 处 理 刚才 讨论 的 模糊 问题 的 重建 方法 的 基础 。 
RF p 投影 的 一 维 傅 里 叶 变 换 为 







图 5.40 图 5.39 中 的 正弦 图 的 反 投 影 


G(@,0) = f į 2(p,0)e "dp (5.11-8) 


其 中 ， 如 式 (4.2-16) 所 示 ，w 是 频率 变量 ,很 容易 理解 该 表达 式 是 给 定 9 值 的 。 用 式 (5.11-3) 代替 
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g(p,9) ， 得 到 表达 式 


G(o,) = | i j "i f ~ f(%,y)5(x cosO+y sind — pje?" dx dy dp 
2 | K | y fx, »| | _6(x cosĝ+y sind — p)e "dp | dx dy (5.11-9) 
es W r f(x, y)e iTO cos8+y sin) dx dy 
其 中 ， 最 后 一 步 遵循 本 节 早 些 时 候 提 到 过 的 冲 激 特性 。 令 zx = wocosg 和 v= wsing 。 式 (511-9) 变 为 


soo| | ji | ie F(x, ye PM) dx 由 | (5.11-10) 


u=% COsO; v=% sind 


我 们 可 以 看 出 该 表达 式 与 指定 u 值 和 v 值 时 f(x,y)[ 见 式 (4.5-7) ] 的 二 维 傅 里 叶 变 换 等 价 ， 即 


G(@, 0) =[F(u, v)], =F(@ cos@, o sin@) (5.11-11) 


=o cos; v=% sind 


HEF, Flu, v) 通常 表示 f(x, y) WAR 

式 (5.11-11) 就 是 众所周知 的 傅 里 叶 切片 定理 (或 投影 切片 定理 ) 。 它 说 明 一 个 投影 的 傅 里 叶 变 换 
是 得 到 投影 区 域 的 二 维 传 里 叶 变 换 的 一 个 切片 。 该 术语 的 来 源 可 用 图 5.41 来 解释 。 如 该 图 所 示 ， 任 
意 一 个 投影 的 一 维 传 里 叶 变换 可 沿 一 个 角度 提取 一 条 线 的 F(u, 值得 到 ， 该 角度 是 产生 投影 所 用 的 角 
度 。 原理 上 , 我 们 可 以 简单 地 使 用 Ku) 的 傅 里 叶 反 变换 得 到 f(x,y)” ,但 这 是 高 代价 的 计算 ， 因 
为 它 涉及 二 维 变换 的 反 变换 。 下 一 节 中 讨论 的 方法 将 有 效 得 多 。 





图 5.41 健 里 叶 切 片 定理 的 说 明 。 投 影 的 一 维 傅 里 叶 变换 是 得 到 投 
影 的 区 域 的 二 维 傅 里 时 变换 的 一 个 切片 。 注 意 角度 2 的 对 应 


5.11.5 ”使 用 平行 射线 束 滤波 反 投 影 的 重建 


如 我 们 在 5.11.1 节 和 例 5.18 中 看 到 的 那样 ， 直 接 得 到 反 投 影 会 生成 不 可 接受 的 模糊 结果 。 所 幸 的 
是 , 解决 该 问题 有 一 种 简单 的 方法 ， 即 在 计算 反 投 影 前 对 投影 做 简单 的 滤波 。 从 式 (4.5-8) PJA, F(u, v) 
的 二 维 反 传 里 叶 变 换 是 , 


O 记 住 ， 即 使 使 用 了 傅 里 叶 反 变 换 ， 恢 复 的 图 像 中 仍 会 存在 模糊 ， 因 为 该 结果 等 同 于 使 用 前 一 节 讨 论 的 方法 得 到 的 结果 。 
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f(%y)= l at F(u,ve?™ du dy (5.11-12) 





2 oo a å 
f(%y) = a = [er , Flo cos0, a sing)ejzrolx ooserysing)o da dO (5.11-13) 


然后 ， 利 用 傅 里 叶 切 片 定 理 有 
Foy) = |E [E Glo, aye £08" ago do dg (5.11-14) 


把 积分 分 离 为 两 个 表达 式 , 一 个 表达 式 的 9 取 值 范围 为 0 到 180°, 另 一 表达 式 的 9 取 值 范围 为 180。 
到 360°, FAIH G(@,8 + 180°) = G(-o, 4) 这 一 事实 (见习 题 5.32) ， 可 以 把 式 (5.11-14) 表达 为 


fy) = |7 | lolG(0,0)e o do dg (5.11-15) 


考虑 关于 ow 的 积分 项 ; 由 式 (5.11-1) 可 以 看 出 ,如 p 那样 , xcos98+ysin9 是 常数 ,因此 , 式 (5.11-15) 
可 写 为 


fœ y)= Elo Gla, ojeda] dg (5.11-16) 


p=x cosO+y sin? 

方 括号 内 的 表达 式 是 一 维 傅 里 叶 反 变换 形式 [ 见 式 (4.2-17) ]， 只 是 附加 了 一 个 |o| 项 ,基于 4.7 节 的 讨 
$, 我 们 可 以 看 出 它 是 一 个 一 维 滤波 函数 。 显 然 ，|@| 是 一 个 斜坡 滤波 器 [ 见 图 5.42 (a) ] "。 这 个 函数 
不 可 积 ， 因 为 其 幅度 在 两 个 方向 上 都 扩展 到 了 too ， 所 以 其 傅 里 叶 反 变换 无 定义 。 理 论 上 ， 可 用 某 种 
方法 来 处 理 该 问题 ， 例 如 使 用 所 谓 的 广义 5 函数 。 实 践 中 ， 该 方法 是 对 和 斜坡 加 窗 ， 使 它 在 定义 的 频率 
范围 之 外 为 零 ， 也 就 是 加 窗 限 制 带宽 的 斜坡 滤波 器 。 


ab 


频率 域 


Ax es. 


图 5.42 (a) 使 用 一 个 盒 状 滤波 器 限制 带宽 后 的 滤波 器 |o| 的 频率 域 前 面 线 ; (b) 空间 域 表示 ; (c) 汉 明 窗 函 数 ; 
(d) 由 图 (a) 和 图 (c) 的 乘积 形成 的 加 窗 后 的 斜坡 滤波 器 ; 〈e) 乘 积 的 空间 域 表 示 (注意 振 铃 的 降低 ) 


限制 一 个 函数 的 带宽 的 最 简 方法 是 , 在 频率 域 中 使 用 一 个 盒子 。 然 而 , 正如 我 们 在 图 4.4 中 看 
到 的 那样 ， 一 个 盒子 有 不 希望 的 振 铃 特 性 ， 因 此 用 一 个 平滑 窗 来 代替 。 图 5.42 (a) 显示 了 使 用 一 个 











397| 


D 斜坡 滤波 器 通常 称 为 Ram-Lak 滤波 器 ， 因 为 该 滤波 器 是 由 Ramachandran and Lakshminarayanan[1971] 首 次 提出 的 。 22 
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盒 状 窗 限 制 带宽 后 的 斜坡 滤波 器 ， 图 5.42 (b) 显示 了 计算 该 滤波 器 的 傅 里 叶 反 变 换 得 到 的 空间 域 
表示 。 如 预期 的 那样 ， 加 窗 滤 波 的 结果 在 空间 域 中 呈现 出 了 明显 的 振 铃 。 我 们 由 第 4 章 可 知 ， 
频率 域 的 滤波 等 于 空间 域 的 卷 积 ， 因 此 ， 使 用 存在 振 铃 的 函数 进行 空间 滤波 也 将 产生 被 振 铃 污 
染 的 结果 。 使 用 平滑 函数 加 窗 有 助 于 这 一 情况 。 常 用 于 实现 一 维 FFT 的 M 点 离散 窗 函 数 由 下 式 
给 出 : 


c+(c 一 1)cos ona 
M -1 


0, 其 他 


当 c=0.54 时 ,该 函数 称 为 汉 明 窗 [根据 Richard Hamming ( 理 查 德 . 汉 明 ) 命 名 ]; 当 c=0.5 时， 该 函 
数 称 为 韩 窗 [根据 Julius von Hann (朱利叶 YG + 韩 ) 命 名 ] "。 汉 明 窗 和 韩 窗 间 的 主要 区 别 是 ， 后 者 末 
尾 的 一 些 点 为 零 。 通 常 ， 两 者 间 的 差别 在 图 像 处 理应 用 中 是 觉察 不 到 的 。 

图 5.42 (c) 显示 了 汉 明 窗 的 曲线 ,图 5.42 (d) 显示 了 汉 明 窗 和 图 5.42 (a) 中 带 限 斜坡 滤波 器 的 积 。 
图 5.42 (e) 显示 了 该 积 在 空间 域 的 表示 ， 这 种 表示 通常 是 通过 计算 其 反 FFT 得 到 的 。 很 明显 ， 该 图 
与 图 5.42 (b) 比较 ,加 窗 斜 坡 中 的 振 铃 现象 减少 了 [ 图 5.42 (b) 和 图 5.42 (e) 中 的 峰值 比分 别 为 2.5 和 3.4 |. 
另 一 方面 ， 因 为 图 5.42 (e) 中 的 中 心 瘀 比 图 5.42(b) 中 的 中 心软 稍 宽 ， 我 们 可 以 预期 ， 由 于 使 用 汉 明 窗 
的 反 投影 有 较 小 的 振 铃 ， 但 稍微 多 一 点 模糊 。 如 例 5.19 所 示 ， 情 况 的 确 如 此 。 

回顾 式 (5.11-8) ，G(w,9) 是 g(p;9) 的 一 维 傅 里 时 变换 ， 这 是 在 一 个 固定 角度 0 得 到 的 单一 投影 。 
式 (5.11-16) 说 明 完 整 的 反 投影 图 像 f(x,y) 是 由 如 下 步 又 得 到 的 : 


1. 计算 每 个 投影 的 一 维 傅 里 叶 变换 。 

2， 如 上 面 说 明 的 那样 ， 用 滤波 函数 |o| 乘 以 每 个 传 里 叶 变换 ， 即 乘 以 一 个 合适 的 窗 ( 如 汉 明 窗 ) 。 

3， 得 到 每 个 滤波 后 的 变换 的 一 维 反 傅 里 叶 变 换 。 

4、 对 步骤 3 得 到 的 所 有 一 维 反 变换 积分 ( 求 和 ) 。 

因为 使 用 了 滤波 函数 ， 所 以 该 图 像 重建 方法 称 为 滤波 反 投影 。 实 践 中 ， 由 于 数据 是 离散 的 ， 
因此 所 有 频率 域 计算 是 使 用 一 维 FFT 算法 来 执行 的 ， 并 且 对 于 二 维 函数 ， 滤 波 是 使 用 第 4 章 中 说 
明 的 相同 基本 过 程 实现 的 。 另 一 方面 ， 我 们 也 可 在 空间 域 使 用 卷 积 来 实现 滤波 ， 如 本 节 稍 后 说 明 
的 那样 。 

前 述 讨论 涉及 滤波 反 投影 的 加 窗 问题 。 在 使 用 任何 取样 数据 系统 时 , 我 们 还 需要 考虑 取样 率 问题 。 
由 第 4 章 我 们 知道 ， 取 样 率 的 选择 对 图 像 处 理 结果 具有 深远 的 影响 。 在 现在 的 讨论 中 ， 有 两 个 取样 考 
虑 。 第 一 个 是 所 用 的 射线 数量 ， 它 决定 了 每 个 投影 的 取样 数 。 第 二 个 是 旋转 角度 的 增 量 ， 它 决定 了 重 
建 图 像 的 数量 (其 和 产生 最 终 的 图 像 ) 。 欠 取样 将 产生 混淆 现象 ， 如 我 们 在 第 4 章 中 看 到 的 那样 ， 它 在 
图 像 本 身 出 现 人 为 缺陷 ( 例如 条 纹 ) 时 出 现 。5.11.6 节 将 详细 讨论 取样 问题 。 


例 5.19 “使 用 沪 波 反 投影 的 图 像 重建 。 
j 投影 





0<w<(M-1) 


h(a) = (5.11-17) 





: () 


D 有 时 ,为 与 汉 明 窗 对 比 ， 韩 窗 也 称 为 汉 宁 窗 。 但 汉 宁 窗 这 一 术语 是 不 正确 的 ， 是 引起 混乱 的 根源 。 
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图 5.43 (a) 显示 了 使 用 斜坡 滤波 器 的 矩形 重建 . 这 一 结果 中 的 最 清晰 特性 是 没有 视觉 上 可 见 的 模糊 。 然 
而 ， 如 预期 的 那样 ， 它 存在 振 铃 现象 ,我 们 能 见 到 暗 汉 的 线条 ， 特 别 是 在 矩形 四 个 角 的 周围 。 这 些 线条 在 
图 5.43 (c) 的 放大 部 分 中 看 得 更 清楚 。 在 斜坡 滤波 器 上 使 用 汉 明 窗 对 振 铃 问题 有 相当 大 的 帮助 ， 如 图 5.43 (b) 和 
图 543 (d) 所 示 ， 但 要 付出 稍微 有 点 模糊 的 代价 。 对 图 5.43 (a) 的 改进 很 明显 (与 未 加 窗 的 斜坡 滤波 器 相 比 ) 。 
由 于 幻影 图 像 没有 像 矩 形 一 样 急 剧 且 突 出 的 过 渡 ,， 因 此 即使 是 使 用 未 加 窗 的 斜坡 滤波 器 ， 振 铃 现象 也 是 感 
ay 正如 图 5.44 (a) 所 示 的 那样 。 使 用 汉 明 窗 会 得 到 稍微 平滑 一 些 的 图 像 , 如 图 5.44 (b) 所 示 。 与 图 5.40 (b) 
相 比 ， 两 个 结果 都 有 较 大 的 改进 ， 这 再 次 证 明了 滤波 反 投影 方法 所 固有 的 优点 。 


图 5.43”(@) 使 用 斜坡 滤波 器 的 矩形 滤波 反 投影 ;(b) 用 汉 明 窗 斜 坡 滤波 器 的 矩形 滤波 
反 投影 。 第 三 行 显示 了 第 一 行 中 图 像 放大 后 的 细节 。 请 与 图 5.40 (a) 比较 


Me) 


15.44 (a) 使 用 斜坡 滤波 器 的 头 部 幻影 的 滤波 反 投影 ; (b) 使 汉 明 窗 
斜坡 滤波 器 的 头 部 幻影 的 滤波 反 投 影 。 请 与 图 5.40 (b) 比较 


在 CT 的 多 数 应 用 中 (特别 是 在 医学 上 ) ， 像 振 铃 这 样 的 人 为 缺陷 影响 严惩 ,因此 须 使 它们 最 小 化 。 
调整 滤波 算法 ， 并 像 5.11.2 节 说 明 的 那样 使 用 大 量 检测 器 ， 是 在 设计 中 有 助 于 减少 这 些 影响 应 考虑 的 
事项 。 

前 述 讨论 是 以 通过 一 个 FFT 实现 得 到 滤波 反 投 影 为 基础 的 。 然 而 ， 由 第 4 章 中 的 卷 积 理论 可 知 ， 
使 用 空间 卷 积 也 可 得 到 相同 的 结果 。 特 别 地 ， 式 (5.11-16) 中 方 括号 内 的 项 是 两 个 频率 域 函数 乘积 的 反 
傅 里 叶 变换 ， 根 据 卷 积 定理 ， 我 们 知道 它 等 于 这 两 个 函数 的 空间 表示 ( 反 傅 里 叶 变 换 ) 的 卷 积 。 换 句 话 
说 , 令 s(p) 表示 |@| 的 反 傅 里 叶 变 换 ， 我 们 将 式 45.11-16) 写 为 





a bile d 


j2nap wat Te ; 
f(x, yel NE lal G(a, A)e' rao) u le [s(p)xg(p, 0)], cosoxy sing d0 


(5.11-18) 
£ KI ” glp, 0)s(x cosO + y sind — pdp | dg 





D 如 果 使 用 了 一 个 窗 函 数 ， 如 汉 明 窗 ， 则 反 傅 里 时 变换 对 加 窗 的 斜坡 函数 执行 。 同 样 ， 我 们 再 次 忽略 了 前 面 提 及 的 关于 连续 反 傅 
里 叶 变 换 的 存在 性 问题 ， 因 为 所 有 的 实现 均 是 使 用 有 限 长 的 离散 量 执行 的 


40 


0 
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其 中 ， 如 第 4 章 中 那样 ， 广 表示 卷 积 。 第 二 行 的 原因 见 前 一 段 的 解释 。 第 三 行 满足 式 (4.2-20) 给 出 


的 卷 积 的 实际 定义 。 

式 (5.11-18) 的 后 两 行 描述 了 相同 的 事情 : 角度 8 处 的 各 个 反 投 影 可 以 用 相应 的 投影 g(p,9) 和 斜坡 
滤波 器 s(p) 的 反 傅 里 叶 变换 的 卷 积 操作 得 到 。 与 以 前 一 样 ， 整 个 反 投影 图 像 可 通过 对 各 个 反 投 影 图 像 
积分 ( 求 和 ) 得 到 。 除 了 计算 上 的 舍 人 误差 外 ， 使 用 卷 积 的 结果 与 使 用 FFT 的 结果 相同 。 在 实际 的 CT 
实现 中 ， 已 证 明 卷 积 通常 在 计算 上 更 有 效 ， 因 此 ， 多 数 现代 CT 系统 使 用 这 种 方法 。 傅 里 叶 变换 在 理 
论 表示 和 算法 开发 中 确实 扮演 了 重要 角色 (例如 , MATLAB 中 的 CT 图 像 处 理 就 是 基于 FFT 的 ) 。 另 外 ， 
我 们 注意 到 ， 在 重建 的 过 程 中 并 不 需要 存储 所 有 的 反 投影 图 像 。 相 反 ， 单 个 求 和 运算 仅 被 最 后 的 反 投 
影 图 像 更 新 。 在 该 过 程 的 未 尾 ， 求 和 运算 将 等 于 所 有 反 投影 的 总 和 。 

最 后 ,我们 要 指出 ， 因 为 斜坡 滤波 器 (甚至 在 被 加 窗 时 ) 在 频率 域 的 直流 项 归 零 ， 故 每 幅 反 投影 图 
像 的 均值 将 为 零 ( 见 图 4.30) 。 这 就 意味 着 每 幅 反 投影 图 像 都 将 有 负 像 素 和 正 像素 。 当 所 有 的 反 投影 图 
像 相 加 形成 最 终 图 像 时 ， 一 些 负 位 置 可 能 变 成 正 的 ， 而 平均 值 可 能 不 是 零 ， 但 通常 最 终 图 像 仍 将 有 负 
像素 

处 理 这 个 问题 的 方法 有 多 种 。 在 不 了 解 关于 平均 值 的 知识 时 ， 最 简单 的 方法 是 接受 该 方法 中 固有 
负 值 的 这 一 事实 ， 并 使 用 式 (2.6-10) 和 式 (2.6-11) 中 描述 的 过 程 来 标定 这 一 结果 。 这 也 是 本 节 采 用 的 方 
法 。 具备 典型 平均 值 的 知识 时 , 可 将 该 值 加 到 频率 域 的 滤波 器 上 , 以 便 抵消 斜坡 并 防止 直流 项 为 零 [ 见 
图 4.31(c) |. 在 空间 域 中 使 用 卷 积 时 ， 和 截断 空 间 滤波 器 长 度 (斜坡 的 反 傅 里 叶 变 换 ) 的 真正 效果 都 可 防 
止 其 有 和 零 均值 ， 这 样 就 完全 避免 了 迫 零 问题 。 


5.11.6 ”使 用 扇形 射线 束 滤波 反 投影 的 重建 


迄今 为 止 的 讨论 都 集中 于 平行 射线 束 。 因 为 它 简 单 而 直观 ， 这 是 传统 上 介绍 计算 机 断层 成 像 的 成 像 
几何 原理 。 然 而 ， 现 代 CT 系统 却 使 用 扇形 射线 y 

束 的 几何 原理 ( 见 图 5.35) , 因此 本 节 剩 下 部 分 将 
讨论 这 一 主题。 

图 5.45 显示 了 一 个 基本 的 扇形 射线 束 成 像 
几何 ， 其 中 检测 器 安放 在 一 个 圆 弧 上 ， 并 假设 
源 的 角度 增 量 相 等 。 令 pla, p) 表示 一 个 鹿 形 
射线 束 投 影 ， 其 中 w 是 相对 于 中 心 射 线 测量 特 
定 检测 器 的 角度 ，p 是 相对 于 y 轴 测 量 的 源 的 
角度 位 移 ， 如 图 所 示 。 在 图 5.45 中 ， 我 们 还 注 
意 到 ， 扇 形 射线 束 中 的 一 条 射线 可 用 一 条 线 
Lp, g) 来 表示 , 在 标准 形式 中 , 它 是 我 们 前 一 
节 讨 论 平 行 射线 束 成 像 几何 中 用 以 描述 一 条 
射线 的 方法 。 这 就 允许 我 们 用 平行 射线 束 的 结 
果 作 为 推导 扇形 射线 几何 公式 的 起 点 。 我 们 继 
续 以 卷 积 为 基础 推导 扇形 射线 滤波 反 投影 的 ”图 545 基本 的 记 形 射线 几何 原理 。 通 过 源 的 中 心 和 原点 


方法 。” (这 里 假设 为 源 的 旋转 中 心 ) 的 线 称 为 中 心 射 线 





D 为 平行 射线 束 几 何 原理 推导 的 傅 里 叶 切片 定理 并 不 能 直接 用 于 扇形 射线 束 。 但 是 , 式 (5.11-19) 和 式 (5.11-20) 莫 定 了 将 扇形 射线 
束 几何 转换 为 平行 射线 束 几 何 的 基础 ， 从 而 允许 我 们 使 用 前 一 节 中 推导 的 滤波 后 的 平行 反 投影 方法 ， 这 时 切片 定理 是 适用 的 。 
本 节 的 未 尾 将 详细 探讨 这 一 点 。 
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我 们 以 图 5.45 中 的 表示 开始 ， 线 L(p, 9) 的 参数 与 扇形 射线 参数 的 关系 是 
0=B+a (5.11-19) 
和 
p=Dsina (5.11-20) 
式 中 , 万 是 从 源 的 中 心 到 效 平 面 的 原点 的 距离 。 
平行 射线 成 像 几 何 的 卷 积 反 投影 公式 已 由 式 ($.11-18) 给 出 。 不 失 一 般 性 ， 假 设 我 们 集中 注意 这 样 
的 物体 ， 它 们 被 包围 在 一 个 以 平面 原点 为 中 心 、 以 7 为 半径 的 圆 形 区 域内 。 那 么 对 于 |p|>7 ， 有 
g(p,9)=0,， 且 式 (5.11-18) 变 为 


1 p2x eT y 
f(x,y) zsh |_, 8(p,0)s(x cos@ +y sin — p)dp dé (5.11-21) 


其 中 ,我 们 利用 了 5.11.1 节 说 明 的 事实 ， 即 相隔 180* 的 投影 互 为 镜像 。 在 这 种 方法 中 ， 式 (5.11-210) 中 
的 外 积分 限 扫 过 整个 圆 ， 正 如 扇形 射线 束 配置 所 要 求 的 那样 ， 检 测 咒 被 安排 在 一 个 圆 上 。 

我 们 感 兴趣 的 是 关于 a 和 的 积分 。 为 这 样 做 ,我 们 将 它 改 为 极 坐标 (r,p) ， 即 令 x=rcosp 和 
y=rsinp ， 由 此 ， 它 变 为 下 式 : 


x cosO+y Sing =r cosy cosO+r sing sinf =r cos(0—9) (5.11-22) 


利用 这 一 结果 ， 我 们 可 把 式 (5.11-21) 表 示 为 
l e2r eT 
fe =5), |8 0)slreos(0 -0)-pldp d0 


这 个 表达 式 的 内 容 并 不 比 平行 射线 束 重建 写成 极 坐标 的 公式 更 多 ,但 积分 还 是 关于 p 和 0 的。 为 了 对 
和 积分 ,要求 用 式 (5.11-19) 和 式 (5.11-20) 进行 坐标 变换 : 


1 ¢ 2r-e pe arcsin(T/D) Dsi Dsi D da d (5.11 23) 
Jo 由 = {rae sina,a+ B)s[r cos(B+a-¢)- sina] cosa da df -ds 


式 中 , 我 们 使 用 了 do dô =D cosa da dB 【[ 见 式 (5.11-13) 的 解释 J. 

这 个 公式 可 以 进一步 简化 。 首 先 ， 注 意 积分 限 从 -w 到 2n 一 gg ,对 来 说 , 扫 过 了 全 部 360 度 。 
因为 8 的 所 有 函数 是 周期 为 2r 的 周期 函数 ， 外 积分 限 可 分 别 用 0 和 2 来 代替 。 项 arcsin(T / D) 对 应 
于 |o| >7 有 一 个 最 大 值 w,，， 超 过 该 值 则 有 g= 0( 见 图 5.46) ， 因 此 ， 我们 可 以 把 内 积分 的 积分 限 分 别 
H-a, 和 ,来 代替 。 最 后 考虑 图 5.45 中 的 线 L(p,0) 。 沿 这 条 线 的 扇形 射线 和 ， 必 须 等 于 沿 同一 条 线 
的 平行 射线 和 (射线 和 是 沿 一 条 线 的 所 有 值 的 和 , 因此 对 于 一 条 给 定 的 射线 , 结果 必须 相同 , 不 管 在 什 
么 坐标 系 下 ) o XIF (a, p) 和 (p,9) 对 应 值 的 任何 射线 和 ， 这 都 是 正确 的 。 这 样 , 令 pla, p) 表示 一 个 
扇形 射线 投影 , 它 满足 pla, B) = 2(p.0) , 且 由 式 (5.11-19) 和 式 ($.11-20) 有 pla, 5)=g(Dsinw,w+D)。 
合并 这 两 个 等 式 为 式 (5.11-23) ， 我 们 有 


"f(r,9)= sf, i pla, B)s[r cos(B salej=p sina|D cosa da dp (5.11-24) 
这 是 基于 滤波 反 投 影 的 基本 扇形 重建 公式 。 
式 (5.11-24) 可 进一步 变换 为 更 熟悉 的 卷 积 形式 。 参 考 图 5.47， 它 可 表示 为 (见习 题 5.33) 
r cos(f +a -—g)-D sina =R sin(a'- a) (5.11-25) 


AF, R 是 在 扇形 射线 中 源 到 任何 一 点 的 距离 ，x' 是 该 条 射线 与 中 心 射 线 的 夹 角 。 注 意 , R Fillo’ Hr, 
o 和 的 值 决定 。 把 式 (5.11-25) 代 入 式 (5.11-24) 得 到 


[406] 
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f(r,9)= : | i f 本 p(a, B)s[R sin(a'-a)]D cosa da dB (5.11-26) 
可 以 证 明 (见习 题 5.34) 
2 
s(R sina) sf os ) s(a) (5.11-27) 
R sing 








图 5.46 包围 感 兴趣 区 域 所 需 的 最 大 c 值 图 5.47 局 形 射线 上 任意 一 点 的 极 坐标 表示 
使 用 该 表达 式 ， 可 以 把 式 (5.11-26) 写 为 
f(r, Q)= Kl “gla Biha’ -ada lap (5.11-28) 
»P)= 0 R? M 3 ‘ 
式 中 ， 
2 
Mo- 了 [2 s(a) (5.11-29) 
2\sing 
和 
q(a@, B) = pla, B)Dcosa (5.11-30) 


我 们 可 以 看 出 式 (5.11-28) 中 方 括号 内 的 积分 是 一 个 卷 积 表达 式 ， 这 样 ， 式 (5.11-24) 中 的 图 像 重建 公式 
就 可 以 如 同 用 函数 g(a,B) 和 h(a) 的 卷 积 那 样 来 实现 。 与 平行 投影 重建 的 公式 不 同 ， 基 于 扇形 射线 束 
投影 重建 包含 有 1/ 且 项 ， 它 是 与 源 的 距离 成 反比 的 加 权 系数 。 实 现 式 (5.11-28) 的 计算 细节 超出 了 当前 
讨论 的 范围 (关于 该 主题 的 详细 论述 ， 请 参阅 Kak and Slaney[2001]) 。 

直接 代替 式 (5.11-28) 的 实现 ， 特 别 是 在 软件 模拟 中 的 一 种 常用 方法 是 : (1) 使 用 式 (5.11-19) 
和 式 (5.11-20) 把 扇形 射线 几何 转换 为 平行 射线 几何 ，(2) 使 用 5.11.5 节 中 开发 的 平行 射线 重建 方法 。 
我 们 将 用 一 个 如 何 这 样 做 的 例子 来 结束 本 节 的 讨论 。 如 早 些 时 候 指 出 的 那样 ， 以 角度 8 获取 的 一 个 肩 
形 射 线 投影 p， 有 一 个 相应 的 以 角度 9 获取 的 平行 射线 投影 g， 因 此 有 

pla, B)=2(p, 9) = g(Dsina, a+ f) (5.11-31) 

其 中 ， 最 后 一 项 来 自 式 (5.11-19) 和 式 (5.11-20) 。 

S AB 表示 连续 扇形 投影 的 角度 增 量 ， 并 令 Ac 是 射线 之 间 的 角度 增 量 ， 它 决定 每 个 投影 中 的 样 
本 数量 。 利 用 约束 
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AB =Aa=y (5.11-32) 
然后 ,利用 p=my 和 a& =ny , 其 中 m 和 nn 是 整数 ， 可 以 把 式 (5.11-31) 写 成 
p(ny, my) = g|Dsinny, (m+n)y| (5.11-33) 


该 式 指出 第 m 个 射线 投影 中 的 第 n RTE, SEP Sm + n) EAT BE PIE n RAR SC (5.11-33) A 
边 的 Dsin ny TRAE TE AT RO AT BEAN SRE, 如 果 取 样 间隔 Aw 和 AZ 大 
粗 ， 则 可 能 导致 模糊 、 振 铃 和 混淆 问题 ， 如 下 例 所 述 。 


例 5.20 使 用 滤波 扇形 反 投影 的 图 像 重 建 。 

图 5.48(a) 显 示 了 : (DEH Aa =AB=1° 产 生 和 矩形 图 像 的 扇形 投影 ，(2) 使 用 式 (5.11-33) 将 每 个 局 形 射 
线 转换 为 相应 的 平行 射线 ，(3) 把 5.11.5 节 推 出 的 滤波 反 投 影 方法 用 于 平行 射线 。 图 5.48(b) 到 (gd) 分 别 显 示 
了 使 用 0.5*、0.25* 和 0.125° 增 量 的 结果 。 所 有 情况 下 都 使 用 了 汉 明 窗 。 这 一 角度 增 量 的 变化 用 于 说 明 欠 取 
样 的 效应 。 

图 5.48 (a) 中 的 结果 清楚 地 指出 ，1° 的 增 量 太 粗 , 模糊 和 振 铃 现象 十 分 明显 。 图 5.48 (b) 中 的 结 ee 

上 很 有 趣 ， 它 与 图 5.43 (b) 相 比 很 差 ， 而 图 5.43 (b) 也 是 使 用 0.5° 的 角度 增 量 产生 的 。 事 实 上 ， 如 图 5.48(c 
所 示 ， 即 便 使 用 0.25* 的 角度 增 量 重建 也 不 比 图 5.43 (b) 好。 如 图 5.48 (d) 所 示 ， 为 使 两 个 结果 可 以 比较 ， ed 
必须 使 用 约 为 0.125° 的 角度 增 量 。 这 个 角度 增 量 可 产生 180x(1/0.25)=720 个 样本 , 这 接近 于 例 5.19 中 的 平行 
投影 所 用 的 849 条 射线 。 这 样 ， 可 以 预料 这 些 结果 在 外 观 上 接近 于 使 用 Aa = 0.125 "时 的 结果 。 


: Dann 


图 .5.48 ”使 用 滤波 扇形 反 投 影 的 矩形 图 像 的 重建 : (a) a 和 的 增 量 为 1 的 结果 ; (b) 增 量 为 0.5° 
的 结果 ; (c) 增 量 为 0.25° 的 结果 ; (d) 增 量 为 0.125° 的 结果 。 请 比较 图 (d) 和 图 5.43 (b) 


除了 如 正弦 干扰 那样 的 混 消 更 为 可 见 外 ， NO ae eet 在 图 5.49(c) 中 ,我 
们 看 到 ， 即 使 使 用 Acw = AZ = 0.25* ， 严 重 的 失真 也 依然 存在 ， 特 别 是 在 椭圆 的 外 围 。 使 用 矩形 时 ,使 用 
0.125° 的 增 量 最 终 产 生 了 可 与 图 5.44 (b) 中 头 部 幻影 反 投影 图 像 相 比 s 这 些 结果 说 明了 在 现代 CT 系 
统 的 扇形 射线 几何 原理 中 ， 必 须 使 用 数 以 千 计 的 检测 器 来 减少 混淆 效应 的 原因 。 


回回 bed 


图 5.49 使 用 滤波 扇形 反 投 影 的 头 部 幻影 图 像 的 重建 : (a) w FB 的 增 量 为 1 的 结果 ; (b) 增 量 为 
0.5° 的 结果 ; (c) 增 量 为 0.25° 的 结果 ; (d) 增 量 为 0.125° 的 结果 。 请 比较 图 (d) 和 图 5.44 (b) 
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小 结 


本 章 中 的 复原 结果 基于 这 样 一 个 假设 ， 即 图 像 退化 可 建 模 为 一 个 线性 的 、 位 置 不 变 的 过 程 ， 以 及 
与 图 像 值 不 相关 的 加 性 噪声 。 即 使 这 些 假设 并 不 完全 正确 ， 用 前 几 章 提出 的 方法 得 到 有 用 的 结果 通常 
也 是 可 能 的 。 

本 章 推导 的 某 些 复原 技术 基于 各 种 最 佳 准则 。“ 最 佳 ”一 词 的 使 用 涉及 严格 的 数学 概念 ， 而 不 是 
指 人 类 视觉 系统 的 最 佳 响 应 。 事 实 上 ， 对 于 视觉 感知 知识 的 缺乏 妨碍 了 图 像 复原 问题 的 一 般 表达 ， 而 
图 像 复 原 问题 要 考虑 到 观察 者 的 偏好 与 能 力 。 在 这 些 限制 条 件 下 ， 本 章 所 介绍 概念 的 优势 是 基本 方法 
的 推导 ， 它 有 合理 的 预测 能 力 和 坚实 的 基础 知识 的 支持 。 

就 像 在 第 3 章 和 第 4 章 中 那样 ， 一 定 的 复原 任务 ， 璧 如 降低 随机 噪声 ， 是 在 空间 域 中 使 用 卷 积 模 
板 来 执行 的 。 我 们 还 发 现 频率 域 对 于 降低 周期 性 噪声 和 对 于 某 些 重要 的 退化 建 模 是 很 理想 的 ， 如 在 图 
像 获取 期 间 因 为 运动 导致 的 模糊 。 我 们 还 发 现 , 对 于 表达 复原 滤波 器 来 说 , 频率 域 也 是 很 有 用 的 工具 ， 
如 维 纳 滤 波 器 和 约束 最 小 二 乘 方 滤波 器 。 

如 第 4 章 中 提 到 的 那样 ， 频 率 域 为 实验 提供 了 直观 且 可 靠 的 基础 。 一 旦 为 给 定 的 应 用 找到 了 令 人 
满意 的 一 种 方法 (滤波 器 ) ， 其 实现 通常 就 是 通过 数字 滤波 器 的 设计 在 频率 域 近似 解决 来 执行 的 。 正 如 
第 4 章 示 尾 指出 的 那样 ， 在 计算 机 中 或 专用 的 硬件 /固件 系统 中 运行 速度 要 快 得 多 。 

投影 重建 图 像 的 论述 是 图 像 处 理 在 这 一 领域 的 基础 , 虽然 它 只 是 介绍 性 的 。 如 5.11 节 说 明 的 那样 ， 
计算 机 断层 (CT) 是 投影 重建 图 像 的 主要 应 用 领域 。 虽 然 我 们 只 关心 X 射线 断层 , 但 5:11 节 建 立 的 原 
理 也 适用 于 其 他 CT 成 像 模式 , 壁 如 SPECT ( 单 光 子 发 射 断层 ) 、PET( 正 电子 发 射 断层 ) MRI (核磁 共 
振 成 像 ) 和 某 些 超声 成 像 模 式 。 


参考 文献 


关于 5.1 节 中 线性 退化 模型 的 其 他 读物 ， 有 Castleman[1996] 和 Pratt[1991]。Peebles[1993] 概 要 介绍 了 噪声 
概率 密度 函数 及 其 特性 ( 见 5.2 节 ) ， 而 Papoulis[1991] 则 深入 且 详 细 地 介绍 了 这 些 概念 。5.3 节 的 参考 文献 有 
Umbaugh[2005]、 Boie and Cox[1992], Hwang and Haddad[1995] 和 Wilburn[1998]。 自 适 应 中 值 滤波 的 资料 见 Eng 
and Ma[2001, 2006]。 自 适应 滤波 器 设计 的 一 般 领 域 ,是 5.3 节 讨 论 的 自 适 应 滤波 器 的 优秀 背景 资料 , Haykin[1996] 
详细 介绍 了 这 一 主题 ,5.4 节 中 的 滤波 器 是 第 4 章 内 容 的 延伸 -5.5 节 内 容 的 其 他 读物 见 Rosenfeld and Kak[1982] 
和 Pratt[1991]。 

估计 退化 函数 这 一 主题 ( 见 5.6 节 ) 是 当前 的 一 个 重要 领域 。 估 计 退 化 函数 的 一 些 早期 技术 见 Andrews and 
Hunt[1977], Rosenfeld and Kak[1982]、Bates and McDonnell[1986] 和 Stark[1987]。 因 为 退化 函数 很 少 能 被 精确 
地 知道 ， 所 以 过 去 几 年 中 人 们 提出 了 大 量 的 技术 ， 其 中 强调 了 特殊 复原 。 例 如 ，Geman and Reynolds[1992] 和 
Hurn and Jennison[1996] 提 出 了 保护 灰 度 急剧 过 渡 来 强调 清晰 度 的 问题 ，Boyd and Meloche[1998] 则 专注 于 复原 
退化 图 像 中 的 细小 物体 。 处 理 模糊 图 像 的 技术 的 例子 见 Yitzhaky et al.[1998]、Harikumar and Bresler[1999]、 
Mesarovic[2000] 和 Giannakis and Heath[2000]。 序 列 图 像 的 复原 也 是 考虑 的 重点 ，Kokaram[1998] 为 这 一 领域 提 
供 了 很 好 的 基础 。 

过 去 几 年 来 ,对 于 5.7 节 到 5.10 节 讨论 的 滤波 方法 ， 图 像 处 理 方面 的 书籍 和 论文 中 已 用 各 种 方法 进行 了 
解释 。 两 种 主要 方法 是 这 些 滤波 器 开发 的 基础 。 一 种 方法 以 使 用 矩阵 理论 的 通用 表达 为 基础 ， 见 Andrews and 


网 Hunt[1977]。 这 种 方法 精致 是 通 用 ， 但 对 于 新 涉猎 该 领域 的 人 来 说 比较 困难 ， 因 为 它 缺 乏 直观 性 。 直 接 基 于 频 
410| 率 域 滤波 的 方法 (本 章 采 用 的 方法 ) 对 于 初次 接触 复原 的 人 来 说 , 通常 比较 容易 , 但 缺少 矩阵 法 统一 的 数学 产 说 
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性 。 两 种 方法 都 可 以 达到 相同 的 结果 ， 但 根据 我 们 的 授课 经 验 ， 初 涉 这 一 领域 的 学 生 更 喜欢 后 一 种 方法 。5.7 节 
到 5.10 节 所 述 滤波 概念 的 补充 读物 是 Castleman[1996]、Umbaugh[2005] 和 Petrou and Bosdogianni [1999], ， 其 中 
后 者 很 好 地 关联 了 二 维 频 域 滤波 器 和 相应 的 数字 滤波 器 。 关 于 二 维 数字 滤波 器 的 设计 ， 请 参阅 Lu and 
Antoniou[1992]。 

计算 机 断层 的 基本 参考 资料 是 Rosenfeld and Kak[1982]、 Kak and Slaney[2001]#il Prince and Links[2006]。 

关于 Shepp-Logan 幻影 的 参考 资料 见 Shepp and Logan[1974]， 关 于 Ram-Lak 滤波 器 起 源 的 详细 内 容 见 

Ramachandran and Lakshminarayanan[ 1971], O’Connor and Fessler[2006] 是 有 关 计 算 机 断层 在 信和 号 与 图 像 处 理 

领域 当前 研究 的 代表 性 论文 。 

本 章 中 讨论 的 多 数 内 容 的 软件 实现 ， 请 参阅 Gonzalez, Woods and Eddins[2004]. 
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718 可 在 本 书 的 网 站 上 找到 。 访 网 站 还 
JRA | ATIENI. 
*5.1 测试 模式 中 白色 条 带 的 尺寸 为 7 像素 宽 、210 像素 高 。 两 个 白色 条 带 之 间 的 间距 为 17 像素 。 有 应 用 
下 面 的 处 理 后 ， 该 图 像 看 起 来 像 什么 ? 
(a) 3x3 BORE AURA 
(b) 5x5 算术 均值 滤波 器 。 
(c) 9x9 算术 均值 滤波 器 。 
注意 : 与 对 该 图 像 滤 波 相关 的 这 一 习题 及 后 面 几 个 习题 看 起 来 有 点 单 
调 , 但 它们 值得 尝试 , 因为 它们 可 帮助 我 们 理解 这 些 滤 波 器 如 何 工 作 。 
理解 了 一 个 特殊 滤波 器 对 图 像 的 影响 后 , 你 的 回答 可 以 是 关于 结果 图 
像 的 简短 描述 。 例如 ,“ 结 果 图 像 将 由 3 个 像素 宽 、206 个 像素 高 的 白 
色 条 带 组 成 ”。 一定 要 描述 白色 条 带 的 任何 变形 ,例如 圆 角 。 你 可 以 
忽略 模板 仅 包含 了 部 分 图 像 像 素 引 起 的 图 像 边 界 效应 。 
5.2 ”使 用 几何 均值 滤波 器 重 做 习题 5.1。 
女 S.3 ”使 用 谐 波 均值 滤波 器 重 做 习题 5.1。 
5.4 ”使 用 逆 谐 波 均值 滤波 器 (O= 1.5) 重 做 习题 5.1。 
女 S.5 ”使 用 逆 谐 波 均值 滤波 (O= -1.5) 重 做 习题 5.1。 
5.6 使 用 中 值 滤波 器 重 做 习题 5.1。 
女 S.7 ”使 用 最 大 值 滤波 器 重 做 习题 5.1。 
5.8 ”使 用 最 小 值 滤波 器 重 做 习题 5.1。 
*5.9 ”使 用 中 点 滤波 器 重 做 习题 5.1。 
5.10 ”分 别 从 图 5.7(e) 和 图 5.7(d) 右 上 角 提取 的 两 个 子 图 像 
如 右 所 示 。 左 侧 的 子 图 像 是 使 用 大 小 为 3x3 的 算术 均 
值 滤波 器 处 理 的 结果 , 右 侧 的 子 图 像 是 使 用 相同 大 小 
的 几何 均值 滤波 器 处 理 的 结果 。 
(a) 解释 为 什么 使 用 几何 均值 滤波 得 到 的 子 图 像 模 
糊 较 少 。 GER: 你 的 分 析 可 通过 检查 灰 度 的 一 
维 阶 跃 过 渡 来 开始 。) 
(b) 解释 右 侧 图 像 中 黑色 元 件 更 粗 的 原因 。 
5.11 根据 式 (5.3-6) 给 出 的 逆 谐 波 滤波 器 ， 回 答 如 下 问题 。 
(a) 解释 为 什么 当 O 为 正 值 时 ， 该 滤波 器 可 有 效 去 除 “胡椒 ”噪声 。 
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(b) 解释 为 什么 当 2 为 负 值 时 ， 该 滤波 器 可 有 效 去 除 “ 盐 粒 ”噪声 。 
(c) 解释 为 什么 选择 的 2 值 不 当时 ， 该 滤波 器 给 出 较 差 结果 (譬如 图 5.9 所 示 的 结果 ) - 
(d) 讨论 当 O=-1.5 时 该 滤波 器 的 特性 。 
(e) 讨论 (对 于 2 为 正和 负 的 情况 ) 恒定 灰 度 级 区 域 中 该 滤波 器 的 特性 。 
给 出 与 表 4.6 中 带 阻 滤波 器 对 应 的 高 斯 和 布 特 沃 斯 带 通 滤波 器 的 公式 。 
以 式 (4.10-5) 的 形式 给 出 高 斯 、 布 特 沃 斯 和 理想 陷 波 带 阻 滤波 器 的 公式 。 
证 明 二 维 连续 余弦 函数 
I (x,y) = Acos(upx + Voy) 
Fh EEL IH Ae Fe HE 
. Ala u u u u 
f(u,v) -- 引 el。 -t yt) +0 rit va te )| 


T 2n 2n 2n 

[ 提示 : 使 用 式 (4.5-7) 中 的 连续 傅 里 叶 变 换 ， 并 以 指数 形式 表示 该 余弦 函数 。] 
使 用 式 (5.4-11) 推导 式 (5.4-13) o 
考虑 一 个 线性 、 位 置 不 变 的 图 像 退化 系统 ， 其 冲 激 响应 为 

h(x-a,y—p)= eer) 
假设 系统 的 输入 是 由 宽度 无 限 小 的 一 条 线 组 成 的 图 像 , 这 条 线 位 于 x= a,y = 处 并 由 f(x,y) = 56(x 一 
a,y 一 b) 建 模 ， 其 中 5 是 一 个 冲 激 函 数 。 假 设 无 噪声 ， 输 出 图 像 g(x,y) 是 什么 ? 
在 图 像 获取 期 间 ， 在 时 间 娓 内 ， 一 幅 图 像 在 垂直 方向 上 做 均匀 线性 运动 。 然 后 ， 在 时 间 A, ie 
动 方向 转 为 水 平方 向 。 假 设 图 像 改变 方向 所 用 的 时 间 可 以 忽略 不 计 ， 且 快门 开关 时 间 同 样 可 以 忽略 
不 计 ， 给 出 模糊 函数 H(u, v) 的 表达 式 。 
考虑 在 x 方 向 均匀 加 速 导致 的 图 像 模 糊 问题 。 如 果 图 像 在 时 刻 {=0 时 静止 , 在 时 间 了 内 ,以 均匀 加 
HE x(t) = ar 加 速 ， 请 找 出 模糊 函数 Hlu,v)。 可 以 假设 快门 开关 时 间 忽 略 不 计 。 
设计 一 个 在 接近 着 陆 时 从 行星 发 送 图 像 的 空间 探测 器 。 在 着 陆 的 最 后 阶段 ， 一 个 控制 推进 器 坏 了 ， 
导致 探测 器 沿 其 垂直 轴 急 速 旋 转 。 在 着 陆 期 间 的 最 后 两 秒 发 送 的 图 像 由 于 这 种 圆周 运动 而 被 模糊 . 
摄像 机 位 于 探测 器 的 底部 ， 沿 探测 器 的 垂直 轴 并 指向 下 方 。 所 幸 的 是 ， 探 测 器 的 转动 也 是 沿 着 垂直 
轴 的 ， 因 此 图 像 是 由 均匀 的 旋转 运动 模糊 的 。 在 每 幅 图 像 获 取 期 间 ， 探测 器 旋转 w12 弧度 。 假 设 在 
图 像 获取 期 间 垂直 运动 可 以 忽略 。 请 以 公式 形式 给 出 复原 图 像 的 解决 方案 。 
如 右 所 示 的 图 像 是 心脏 立体 再 现 的 一 个 模糊 的 二 维 投影 。 已 知 
图 像 右 侧 底部 的 每 个 十 字 线 宽 4 像素 、 长 20 像 素 ， 且 模糊 之 前 
的 灰 度 值 为 2355。 试 给 出 一 步 一 步 的 过 程 ， 指 出 你 怎样 应 用 刚才 
提供 的 信息 得 到 模糊 函数 Hu, v)。 
SEX 射线 成 像 几 何 产生 了 一 种 模糊 退化 ， 这 种 模糊 退化 可 用 空 
间 圆 对 称 函 数 
与 该 遥感 图 像 的 卷 积 来 建 模 。 假 设 是 连续 变量 ， 证 明 频 率 域 中  ，( 原 图 像 由 GE 医学 系统 提供 ) 
的 退化 由 下 式 给 出 : 








e 2n? 


H (u,v) = —J2no (u? + y? je atua 
(提示 : 从 494 节 、 表 43 中 的 性 质 13 和 习题 426 AF. ) 
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太 5.22 ”使 用 习题 5.21 中 的 传递 函数 ， 给 出 几何 均值 滤波 器 的 表达 式 ， 假 设 噪 声 功率 谱 和 未 退化 信号 之 比 
为 常数 。 然 后 ， 给 出 维 纳 滤波 器 的 表达 式 。 

5.23 ”使 用 习题 5.21 中 的 传递 函数 ， 给 出 约束 最 小 二 乘 方 滤波 器 的 最 终 表 达 式 。 

5.24 ”假设 图 5.1 中 的 模型 是 线性 上 且 位 置 不 变 的 ， 并 且 噪 声 与 图 像 是 不 相关 的 。 证 明 输 出 功率 谱 为 


(Gv) =|H (u,v) Fav)? +N u,v]? 


参考 式 (5.5-17) 和 式 (4.6-18) 。 
5.25 ”Cannon[1974] 建 议 过 一 个 满足 条 件 


[Fv = [RG [Gu yw) 


的 复原 滤波 器 R(u ,并 且 以 强制 复原 图 像 的 功率 谱 | 广 (u,v)| 等 于 原 图 像 的 功率 谱 |F(u, 中 为 前 提 
假设 该 图 像 和 噪声 是 不 相关 的 。 

x (a) 根据 |F(w,w)| 、| 五 (wv) 和 |N(u,w)| 给 出 RG, v)。[ 提示: 参阅 图 5.1、 式 (5.5-17) 和 习题 5.24 ] 
(b) 使 用 (a) 中 得 到 的 结果 来 说 明 式 (5.8-2) 给 出 的 结果 。 

5.26 ”一 位 天 文学 家 使 用 一 台 高 倍 望 远 镜 观 察 到 的 图 像 有 点 模糊 。 制 造 商 告诉 天 文学 家 , 设备 是 按说 明 书 
操作 的 。 望 远 镜 镜头 把 图 像 聚 焦 到 高 分 辩 率 CCD 成 像 阵列 上 ， 然 后 望远镜 使 用 电子 学 方法 将 图 像 
转换 为 数字 图 像 。 试 图 通过 传导 控制 实验 室 的 实验 使 用 镜头 和 成 像 传感器 来 改进 这 种 情况 是 不 可 能 
的 ， 因 为 望远镜 部 件 的 尺寸 和 重量 大 太 。 和 天 文学 家 听 说 你 是 一 位 成 功 的 图 像 处 理 专家 , 打 电 话 要 求 
你 帮助 她 提出 将 图 像 变 得 清晰 一 些 的 数字 图 像 处 理 方 案 。 假设 你 能 得 到 的 图 像 仅仅 是 星体 图 像 , 请 
问 你 如 何 解 决 该 问题 ? 

太 5.27 一 位 考古 学 教授 正在 从 事 罗马 帝国 时 期 流通 货币 方面 的 研究 工作 。 他 最 近 了 解 到 对 其 研究 起 决定 性 
作用 的 4 个 罗马 硬币 陈列 在 伦敦 的 大 英 博 物 馆 中 。 遗 憾 的 是 , 在 到 达 博 物 馆 后 ,他 被 告知 这 些 硬币 
最 近 被 盗 了 。 进 一 步 的 研究 表明 ， 依靠 博物 馆 保 存 的 这 些 硬 币 的 照片 也 可 行 。 遗 憾 的 是 , 硬币 的 照 
片 模糊 为 一 些 点 ， 以 至 于 无 法 识别 数据 和 小 标记 。 模糊 的 原因 在 于 拍摄 照片 时 摄像 机 散 焦 。 作 为 一 
名 图 像 处 理 专家 和 教授 的 朋友 ,要 求 你 帮助 决定 计算 机 处 理 是 否 能 用 于 复原 图 像 , 并 为 教授 指出 在 
哪里 能 读 出 这 个 标记 。 而且 你 被 告知 ,与 同一 时 期 其 他 有 代表 性 的 硬币 一 样 ,用 于 拍摄 这 些 照片 的 
摄像 机 仍然 可 用 。 提 出 解决 这 一 问题 的 一 步 一 步 的 过 程 。 

5.28 画 出 下 列 方形 图 像 的 雷 登 变换 。 在 画 出 的 图 形 中 定量 地 标 出 所 有 的 重要 特性 。 图 (a) 由 中 间 的 一 个 


点 组 成 ， 图 (b) 沿 对 角 线 有 两 个 点 。 根 据 灰 度 剖面 来 描述 你 对 图 (c) 的 解决 方案 。 假设 使 用 平行 射线 
几何 理论 。 








(3) *(b) (c) 
Sy i Mt as : 7 
S.29 ESE (ay) = Aep =P) REE IRGA) ] 是 a(p.0)= 人 esp 人 
oO 


[ 提示: 参考 例 5.17， 这 里 我 们 使 用 对 称 性 来 简化 积分 。 ] 
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5.30% (a) 证 明 单位 冲 激 函数 5(x, y) 的 雷 登 变换 [ 见 式 (5.11-3) ] 是 p0 平面 中 通过 原点 的 一 条 垂直 线 。 
(b) WEI S(x- xo y- yo) 的 雷 登 变换 是 在 00 平面 中 的 一 条 正弦 曲线 。 
5.31 证 明 雷 登 变换 [ 见 式 (5.11-3) ] 的 下 列 性 质 的 正确 性 : 
k (a) 线性 : 雷 登 变换 是 一 个 线性 算 子 ( 见 2.6.2 节 关 于 线性 算 子 的 定义 ) 。 
(b) 平移 性 质 : f(x- xoy- yo) 的 雷 登 变换 是 g(p 一 x0cos0 一 yosin9,0) 。 
% (c) 卷 积 性 质 : 证 明 两 个 函数 的 卷 积 的 雷 登 变换 等 于 两 个 函数 的 雷 登 变换 的 卷 积 。 
5.32 ”给 出 由 式 (5.11-14) 推导 出 式 (5.11-15) 的 步骤 。 你 需要 用 到 性 质 G(w,8 +180°)= G(-w,0) 。 
六 5.33 ”证 明 式 (5.11-25) 的 正确 性 。 
5.34 证 明 式 (5.11-27) 的 正确 性 。 
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在 图 像 处 理 中 ， 彩 色 的 运用 主要 受 两 个 因素 的 推动 。 第 一 ， 彩 色 是 一 个 强 有 力 的 描绘 子 ， 它 常常 
可 简化 从 场景 中 提取 和 识别 目标 ; 第 二 ， 人 可 以 辨别 几 千 种 彩色 色调 和 亮度 ,但 相 比 之 下 只 能 辨别 几 
十 种 灰 度 色调 。 第 二 个 因素 在 人 工 图 像 分 析 中 特别 重要 。 

彩色 图 像 处 理 可 分 为 两 个 主要 领域 : 全 彩色 处 理 和 伪 彩 色 处 理 。 在 第 一 类 中 ， 通 常 要 求 图 像 用 全 
彩色 传 感 希 获 取 ， 如 彩色 电视 摄像 机 或 彩色 扫描 仪 。 在 第 二 类 中 ， 问 题 是 对 一 种 特定 的 单 色 灰 度 或 灰 
度 范围 赋予 一 种 颜色 。 到 目前 为 止 ， 多 数 数字 彩色 图 像 处 理 是 在 伪 彩 色 层 面 完 成 的 。 然 而 ， 在 过 去 的 
十 年 里 ， 彩 色 传 感 器 和 用 于 处 理 彩 色 图 像 的 硬件 的 价格 上 变 得 更 容易 接受 ， 导 致 全 彩色 图 像 处 理 技术 
的 应 用 日 益 广泛 ， 包 括 出 版 、 可 视 化 和 互联 网 应 用 。 

在 后 续 的 讨论 中 ,我 们 会 看 到 前 面 几 章 介 绍 的 一 些 灰 度 方法 可 直接 用 于 彩色 图 像 。 其 他 方法 则 要 
求 将 灰 度 方法 重新 表达 为 与 本 章 推导 的 彩色 空间 的 性 质保 持 一 致 。 本 书 讨论 的 这 些 技术 远 未 穷尽 ， 仅 
是 用 于 彩色 图 像 处 理 的 一 些 方法 。 


6.1 彩色 基础 


虽然 人 的 大 脑 感知 和 理解 颜色 所 遵循 的 过 程 还 是 未 完全 了 解 的 一 种 生理 与 心理 现象 ， 但 颜色 的 物 
理性 质 可 由 实验 和 理论 结果 支持 的 基本 形式 来 表示 。 

1666 年 ， 艾 萨 克 ' 牛顿 (Isaac Newton) 发 现 了 一 种 现象 ， 当 一 束 太 阳光 通过 一 个 玻璃 棱镜 时 ， 出 
现 的 光束 不 是 白色 的 ， 而 是 由 一 端 为 紫色 、 另 一 端 为 红色 的 连续 色谱 组 成 。 如 图 6.1 所 示 ， 色 谱 可 分 为 
6 个 较 宽 的 区 域 : 紫色 、 蓝 色 、 绿 色 、 黄 色 、 橙 色 和 红色 。 观 察 全 彩色 时 ( 见 图 6.2) ， 色 谱 未 尾 的 颜色 
不 是 突变 的 ， 而 是 从 一 种 颜色 混合 平滑 地 过 渡 到 下 一 种 颜色 的 。 

基本 上 , 人 类 和 某 些 其 他 动物 感知 物体 颜色 是 由 物体 反射 光 的 性 质 决 定 的 。 如 图 6.2 所 示 , 可 见 光 
由 电磁 波谱 中 相对 较 窑 的 频段 组 成 。 物 体 反射 的 光 若 在 所 有 可 见 光波 长 范围 内 是 平衡 的 ， 那么 对 观察 
者 来 说 显示 为 白色 。 然 而 ， 一 个 物体 反射 有 限 的 可 见 光 谱 时 ， 则 呈现 某 种 颜色 。 例 如 ， 绿 色 物体 反射 
有 具有 500~570 nm 范围 内 主要 波长 的 光 ， 吸 收 其 他 波长 的 多 数 能 量 。 


417 
418 
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图 6.1 “白光 通过 棱镜 看 到 的 色谱 ( 原 图 像 由 General Electric 公司 的 Lamp Business 分 公司 提供 ) 


视频 无 线 电波 





700 1000 1500 


“波长 TEA 600 
图 6.2 可 见 范围 电磁 波谱 的 波长 组 成 ( 原 图 像 由 General Electric 公司 的 Lamp Business 分 公司 提供 ) 


光 的 特性 是 色彩 学 的 核心 。 如 果 光 是 无 色 的 (缺乏 颜色 ) , 那么 其 属性 仅 是 亮度 或 数值 。 无 色光 就 
是 观察 者 在 黑白 电视 机 上 看 到 的 光 ， 且 它 是 迄今 为 止 我 们 对 图 像 处 理 的 讨论 的 隐 含 分 量 。 如 第 2 章 
中 定义 并 多 次 使 用 的 那样 , 术语 灰 度 级 仅 提供 了 一 个 亮度 的 标量 度量 , 它 的 范围 从 黑色 到 灰色 最 终 到 
白色 。 

彩色 光大 约 覆 盖 电 磁 波 谱 中 400~700 nm 的 范围 。 用 来 描述 彩色 光源 质量 的 3 个 基本 量 是 辐射 、 
光 强 和 亮度 。 辐 射 是 从 光源 流出 的 能 量 的 总 量 , 通 常用 瓦特 (W) 来 度量 。 光 强 用 流明 来 度量 ， 它 给 出 
观察 者 从 光源 感知 的 能 量 总 和 的 度量 。 例 如 ， 由 远 红 外 波谱 范围 的 光源 发 出 的 光 ， 可 能 具有 很 大 的 能 
量 (辐射 ) ， 但 观察 者 却 很 难 感知 到 它 ; 它 的 光 强 几乎 是 零 。 最 后 ， 亮 度 是 一 个 主观 描绘 子 ， 它 实际 上 
是 不 可 度量 的 。 它 体现 了 无 色 的 强度 的 概念 ， 并 且 是 描述 色彩 感觉 的 一 个 关键 因素 。 

如 2.1.1 节 中 解释 的 那样 ， 人 眼中 的 锥 状 细胞 是 负责 彩色 视觉 的 传感器 。 详 细 的 实验 结果 已 经 确 
定 ， 人 有 眼中 的 600~700 万 个 锥 状 细胞 分 为 3 个 主要 的 感知 类 别 ， 分 别 对 应 于 红色 、 绿 色 和 蓝 色 。 大 约 
65% 的 锥 状 细胞 对 红 光 敏感 ，33% 对 绿 光 敏感 ， 只 有 2% 对 蓝光 敏感 (但 蓝 色 锥 状 细胞 对 蓝光 更 敏感 ) 。 
图 6.3 显示 了 人 眼中 的 红色 、 绿 色 和 蓝 色 锥 状 细胞 吸收 光 的 平均 实验 曲线 。 由 于 人 眼 的 这 些 吸收 特性 ， 
所 看 到 的 彩色 是 所 谓 的 原色 红 (R) 、 绿 (G) 、 蓝 (B) 的 各 种 组 合 。 为 标准 化 起 见 ，CIE (国际 照明 委员 会 ) 
于 1931 年 指定 了 如 下 特定 波长 值 为 三 原色 : WE =435.8 nm, 绿色 =546.1 nm， 红 色 =700 nm。 这 一 标 
准 在 图 6.3 所 示 的 详细 实验 曲线 于 1965 年 被 采用 之 前 就 做 了 规定 。 因此 CIE 标准 只 是 近似 对 应 于 实验 
数据 。 由 图 6.2 和 图 6.3 我 们 注意 到 ， 没 有 单一 的 颜色 可 称 为 红色 、 绿 色 或 蓝 色 。 另 外 ,应 记 住 为 标准 
化 目的 而 定 的 三 个 特定 原色 波长 ， 并 不 意味 着 这 三 个 固定 的 RGB 分 量 单独 作用 就 能 产生 所 有 谱 ， 这 
一 点 很 重要 。“ 原 色 ' 一 词 的 使 用 已 被 广泛 误解 为 : 三 个 标准 原色 以 各 种 强度 比 混合 在 一 起 时 ， 可 以 产 
生 所 有 的 可 见 彩色 。 如 我 们 很 快 将 会 看 到 的 那样 ， 这 一 解释 是 不 正确 的 ， 除 非 波长 允许 变化 ， 而 在 这 
种 情况 下 将 不 再 有 三 个 固定 的 标准 原色 。 

原色 相 加 可 以 产生 二 次 色 ， 如 深 红 色 (红色 加 蓝 色 ) 、 青 色 (绿色 加 蓝 色 ) 和 黄色 (红色 加 绿色 ) 。 以 
正确 的 亮度 把 三 原色 或 把 与 二 次 色相 对 应 的 原色 混合 ， 即 可 产生 白光 。 这 一 结果 示 于 图 6.4(a) ， 它 还 
说 明了 三 原色 及 其 混合 产生 二 次 色 。 

光 的 原色 与 颜料 或 着 色 剂 的 原色 之 间 的 区 别 很 重要 。 后 者 的 原色 定义 为 减 去 或 吸收 光 的 一 种 
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原色 ， 并 反射 或 传输 另外 两 种 原色 。 因此， 颜料 的 原色 是 深 红色 、 青 色 和 黄色 ， 而 三 次 色 是 红色 、 
绿色 和 蓝 色 。 这 些 颜 色 示 于 图 6.4(b) 。 将 三 种 颜料 原色 或 与 二 次 色 对 应 的 原色 适当 混合 ， 即 可 产生 
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图 6.3 ”以 波长 为 函数 ， 人 眼中 的 红色 、 绿 色 和 蓝 色 锥 状 细胞 对 光 的 吸收 曲线 


彩色 电视 接收 机 是 光 的 彩色 相 加 性 质 的 一 个 例子 。 许 多 彩色 电视 荧光 屏 (CRT， 阴 极 射 线 管 ) 的 
内 部 是 由 电 敏 荧光 粉 按 三 角形 点 阵 的 模式 组 成 的 。 


当 激 发 时 ,三 色 组 中 的 每 二 点 谨 生 三 原色 中 的 = 种 kee 
光 。 发 红 光 的 荧光 点 的 亮度 由 显像管 内 的 电子 枪 调 oe 


制 ， 电 子 枪 产生 的 脉冲 与 电视 摄像 机 看 到 的 “红色 
能 量 ”相对 应 。 每 个 三 色 组 中 的 绿色 荧光 点 和 蓝 色 
荧光 点 以 相同 的 方式 调制 。 在 电视 接收 机 上 观察 到 
的 效果 是 来 自 每 个 三 色 组 的 三 原色 “加 ”在 一 起 ， 
并 被 人 眼中 对 颜色 敏感 的 锥 状 细胞 以 全 彩色 图 像 
的 方式 接收 。 以 所 有 这 三 种 颜色 每 秒 连续 变化 30 
幅 图 像 ， 在 荧光 屏 上 即 可 完成 连续 图 像 的 显示 。 
CRT 显示 器 正在 被 平板 数字 技术 取代 ， 辟 如 液 
晶 显 示 器 (LCD) 和 等 离子 设备 。 虽 然 它们 的 基本 原 
理 与 CRT 不 同 , 但 在 某 种 意义 上 ， 这 些 技术 及 类 似 
的 技术 使 用 了 一 个 相同 的 原理 ， 即 它们 都 要 求 三 个 
子 像素 (红色 、 绿 色 和 蓝 色 ) 去 产生 单个 彩色 像素 。 
LCD 使 用 极 化 光 的 特性 来 阻止 光 或 使 光 通 过 LCD 
屏幕 ， 在 有 源 矩 阵 显 示 技 术 的 情况 下 ， 使 用 薄膜 晶 光 和 颜料 的 原色 及 二 次 色 
PRE (TET) 提供 适当 的 信号 对 屏幕 上 的 每 个 像素 寻 
址 。 光 滤波 器 用 于 在 每 个 像素 三 色 组 位 置 上 产生 光 SA AME E een en Ceon 
的 三 原色 。 在 等 离子 装置 中 ， 像 素 是 用 于 产生 三 原 Se at ea 
色 之 一 的 涂 有 荧光 粉 的 微小 气体 单元 。 各 个 小 单元 以 类 似 于 LOD 的 方式 寻 址 。 这 种 三 像素 组 的 同等 寻 
址 能 力 是 数字 显示 的 基础 。 
通常 用 以 区 别 不 同 颜 色 特性 的 是 亮度 、 色 调和 饱和 度 。 正 如 本 节 前 面 指出 的 那样 ， 亮 度 具体 表 | 
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达 了 无 色 的 强度 概念 。 色 调 是 光波 混合 中 与 主 波长 有 关 的 属性 。 色 调 表示 观察 者 感知 的 主要 颜色 。 这 


样 ， 当 我 们 说 一 个 物体 为 红色 、 橙 色 或 黄色 时 ， 指 的 是 其 色调 。 饱 和 度 指 的 是 相对 纯净 度 ， 或 一 种 颜 
色 混 合 白光 的 数量 。 纯 谱 色 是 全 饱和 的 。 如 深 红色 ( 红 加 白 ) 和 淡 紫 色 ( 紫 加 白 ) 这 样 的 彩色 是 欠 饱 和 的 ， 
饱和 度 与 所 加 白光 的 数量 成 反比 。 
色调 与 饱和 度 一 起 称 为 色 度 ， 因 此 ， 颜色 可 用 其 亮度 和 色 度 来 表征 。 形 成 任何 特殊 彩色 的 红 、 绿 、 
蓝 的 数量 称 为 三 色 值 ， 并 分 别 表示 为 了 了 和 2Z。 这样， 一 种 颜色 就 可 由 其 三 色 值 系数 定义 为 
ei 
X+Y+Z 
a 
ia ee 





(6.1-1) 


y (6.1-2) 


和 
Z 


Zz = 一 -一 (6.1-3) 
X+Y+Z 


从 以 上 公式 可 得 ? 

x+y+z=1 (6.1-4) 
对 可 见 光谱 内 光 的 任何 波长 ， 用 于 产生 对 应 于 该 波长 的 颜色 所 需 的 三 色 值 ， 可 直接 从 大 量 实验 结果 编 
制 的 曲线 或 表 中 得 到 (Poynton[1996]) ， 也 可 参阅 早期 的 文献 Walsh[1958] 和 Kiver[1965]。 

确定 颜色 的 男 一 种 方法 是 使 用 CIE 色 度 图 ( 见 图 6.5) ,该 图 以 x( 红 ) 和 y( 绿 ) 的 函数 表示 颜色 的 组 成 . 
对 于 x 和 yy 的 任何 值 ， 相 应 的 z 值 ( 蓝 色 ) 可 由 式 (6.14) 得 到 , GE z=- aty) Bl, Aes 中 标记 为 
绿色 的 点 大 约 有 62% 的 绿色 和 25% 的 红色 成 分 。 从 式 (6.1-4) 可 得 到 蓝 色 的 成 分 约 为 13%。 

从 380 nm 的 紫色 到 780 nm 的 红色 的 各 种 谱 色 的 位 置 ， 标 在 舌 形 色 度 图 周围 的 边界 上 。 这 些 都 是 
示 于 图 6.2 的 谱 图 中 的 纯色 。 任 何不 在 边界 上 而 在 色 度 图 内 部 的 点 ， 都 表示 谱 色 的 混合 色 。 示 于 图 6.5 
中 的 等 能 量 点 与 三 原色 的 百分比 相对 应 ， 它 表示 白光 的 CIE 标准 。 位 于 色 度 图 边界 上 的 任何 点 都 是 全 
饱和 的 。 当 一 点 离开 边界 并 接近 等 能 量 点 时 , 该 颜色 中 就 加 入 了 更 多 的 白光 , 它 就 变 成 欠 饱 和 的 颜色 ， 
等 能 量 点 的 饱和 度 为 零 。 

色 度 图 对 于 色彩 混合 非常 有 用 ， 因 为 色 度 图 中 连接 任意 两 点 的 直线 段 定义 了 所 有 不 同 颜色 的 
变化 , 这 些 颜色 可 以 由 这 两 种 颜色 的 加 性 组 合 得 到 。 例 如 ,考虑 图 6.5 中 从 红 点 到 绿 点 画 出 的 一 条 
直线 ， 如 果 红 光 多 于 绿 光 ， 则 确切 地 表示 新 颜色 的 点 将 处 在 该 线段 上 ， 但 与 绿 点 相 比 它 更 接近 于 
红 点 。 类 似 地 ， 从 等 能 量 点 到 位 于 色 度 图 边界 上 的 任意 一 点 画 一 线段 ， 将 定义 那个 特定 谱 色 的 所 
有 色调 。 

把 这 一 过 程 扩展 到 三 种 颜色 很 简单 。 要 确定 从 色 度 图 中 任何 给 定 的 三 种 颜色 得 到 的 颜色 范围 ， 
我 们 可 简单 地 在 三 个 色 点 之 间 画 出 连接 线 ， 结 果 是 一 个 三 角形 ， 三 角形 边界 上 或 三 角形 内 的 任何 颜 
色 都 可 以 由 三 种 初始 颜色 的 不 同 组 合 产 生 。 以 任意 固定 颜色 为 项 点 的 三 角形 无 法 包围 图 6.5 中 的 整 
个 颜色 区 域 。 这 种 观察 结果 从 图 解 上 支持 了 早期 的 结论 ， 即 用 3 个 单一 旦 固定 的 原色 无 法 得 到 所 有 
颜色 。 

图 6.6 中 的 三 角形 显示 了 由 RGB 监视 器 产生 的 典型 颜色 范围 ( 称 为 彩色 全 域 ) 。 三 角形 内 的 不 规则 
区 域 是 今天 高 质量 彩色 打印 设备 的 代表 性 彩色 域 。 彩 色 打印 设备 的 彩色 域 的 边界 是 不 规则 的 ， 因 为 彩 
色 打 印 是 相 加 色彩 和 相 减 色彩 混合 的 组 合 , 与 在 监视 器 上 显示 颜色 (基于 三 种 高 度 可 控 的 原色 光 的 相 加 ) 
相 比 ， 这 是 一 个 更 加 难以 控制 的 过 程 ， 监 视 器 是 以 三 个 高 度 可 控 的 原色 光 的 相 加 为 基础 的 。 


D 这 段 文 字 中 使 用 的 x,y,z 遵循 国际 惯例 。 这 些 不 应 与 书 中 其 他 小 节 用 于 表示 空间 坐标 的 (x, 访 相 混淆 。 
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《波长 为 纳米 ) 





图 6.5 色 度 图 ( 原 图 像 由 General Electric 公司 的 Lamp Business 分 公司 提供 ) 
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图 6.6 彩色 监视 器 的 典型 彩色 域 (三 角形 区 域 ) 和 彩色 打印 设备 的 典型 彩色 域 (不 规则 区 域 ) 
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6.2 彩色 模型 


彩色 模型 (也 称 为 彩色 空间 或 彩色 系统 ) 的 目的 是 ， 在 某 些 标准 下 用 通常 可 以 接受 的 方式 方便 地 对 
彩色 加 以 说 明 。 本 质 上 ， 彩色 模型 是 坐标 系统 和 子 空间 的 说 明 ， 其 中 ， 位 于 系统 中 的 每 种 颜色 都 由 单 
个 点 来 表示 。 

现在 所 用 的 大 多 数 彩色 模型 不 是 面向 硬件 (如 彩色 监视 器 和 打印 机 ) 的, 就 是 面向 应 用 的 (例如 针 
对 动画 的 彩色 图 形 创作 ) 。 在 数字 图 像 处 理 中 , 实际 中 最 通用 的 模型 如 下 : 面向 硬件 的 RGB ( 红 、 绿 、 
蓝 ) 模 型 , 用 于 彩色 监视 器 和 一 大 类 彩色 视频 摄像 机 ; CMY ( 青 、 粉红 、 黄 ) 模 型 和 CMYK( 青 、 粉 红 、 
黄 、 黑 ) 模 型 ， 用 于 彩色 打印 机 ; HSI( 色 调 、 饱 和 度 、 亮 度 ) 模 型 ， 这 种 模型 更 符合 人 描述 和 解释 颜 
色 的 方式 。HSI 模型 还 有 另 一 个 优点 ， 它 可 以 解除 图 像 中 颜色 和 灰 度 信息 的 联系 ， 使 其 更 适合 本 书 
中 给 出 的 许多 灰 度 处 理 技术 。 现 在 使 用 的 彩色 模型 还 有 很 多 ， 原 因 在 于 色彩 学 是 一 个 包括 许多 应 用 
的 宽泛 领域 。 这 里 试图 详细 研究 其 中 的 几 个 模型 ， 因 为 这 些 模 型 更 有 意义 且 更 有 益 。 然 而 , 根据 现 有 
的 任务 ， 本 章 讨论 的 模型 是 图 像 处 理 的 主要 模型 。 掌 握 了 本 章 的 内 容 后 ， 理 解 今天 所 用 的 其 他 彩色 
模型 时 就 不 会 遇 到 困难 。 


6.2.1 RGB 彩色 模型 


在 RGB 模型 中 ， 每 种 颜色 出 现在 红 、 绿 、 蓝 的 原色 光谱 成 分 中 。 该 模型 基于 笛 卡 儿 坐标 系 。 所 
考虑 的 彩色 子 空间 是 图 6.7 所 示 的 立方 体 ， 图 中 RGB 原色 值 位 于 3 个 角 上 ; 三 次 色 青 色 、 深 红色 和 黄 
色 位 于 另外 3 个 角 上 ,黑色 位 于 原点 处 ， 白 色 位 于 离 原 点 最 远 的 角 上 。 在 该 模型 中 ， 灰 度 (RGB 值 相等 
的 点 ) 沿 着 连接 这 两 点 的 直线 从 黑色 延伸 到 和 白色。 该 模型 中 的 不 同 颜色 是 位 于 立方 体 上 的 或 立方 体内 部 
的 点 ， 且 由 自 原 点 延伸 的 向 量 来 定义 。 为 方便 起 见 ， 假 定 所 有 颜色 值 均 已 归 一 化 ， 因 此 图 6.7 所 示 的 立 
方 体 是 一 个 单位 立方 体 ， 即 R, G 和 2B 的 所 有 值 都 假定 在 区 间 [0, 1] 内 。 

在 RGB 彩色 模型 中 表示 的 图 像 由 3 个 分 量 图 像 组 成 , 每 种 原色 一 幅 分 量 图 像 。 当 送 入 RGB 监视 器 
时 ,这 3 幅 图 像 在 屏幕 上 混合 生成 一 幅 合 成 的 彩色 图 像 ， 如 在 6.1 节 所 说 明 的 那样 。 在 RGB 空间 中 ， 
表示 每 个 像素 的 比特 数 称 为 像素 深度 。 考 虑 一 幅 RGB 图 像 ， 其 中 每 幅 红 、 绿 、 蓝 图 像 都 是 一 幅 8 比特 
图 像 ， 在 这 种 条 件 下 ， 可 以 说 每 个 RGB 彩色 像素 [ 即 (R, G, B) 值 的 三 元 组 ] 有 24 比特 的 深度 〈3 个 图 
像 平 面 乘 以 每 个 平面 的 比特 数 ) 。 术 语 全 彩色 图 像 通常 用 来 表示 一 幅 24 比特 的 RGB 彩色 图 像 。 在 24 比特 
RGB 图 像 中 ， 颜 色 总 数 是 (2 =16777216。 图 6.8 显示 了 与 图 6.7 对 应 的 24 比特 彩色 立方 体 。 


蓝 色 [oo 青色 


深 红 色 











(0, 1, 0) 
绿色 
(1,0, WDE 
wr 红色 
R 
图 6.7 RGB 彩色 立方 体 示 意图 。 沿 主 对 角 线 的 点 有 图 6.8 RGB 24 比特 彩色 立方 体 


从 原点 的 黑色 至 点 (1, 1, 1) 的 白色 的 灰 度 值 
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例 6.1 生成 RGB 彩色 立方 体 的 隐藏 面 和 齐 面 。 

图 6.8 所 示 的 立方 体 是 实心 的 ， 它 由 前 一 段 中 提 到 的 (2 = 16 777 216 种 颜色 组 成 。 MEEN- 
种 简便 方法 是 , 生成 一 个 彩色 平面 立方体 的 表面 或 剖面 ) 。 这 是 通过 固定 三 种 颜色 中 的 一 种 并 让 其 他 两 种 颜 
色 变 化 来 完成 的 。 例 如 , 在 图 6.8 中 , 通过 立方 体 中 心 并 与 GB 平面 平行 的 剖面 是 平面 (127, G, B), 其 中 G, B 
=0, 1,2,…,255。 这 里 , 我 们 使 用 了 实际 像素 值 ,而 不 是 为 数学 上 的 方便 而 在 [0, 1] 区 间 内 的 归 一 化 值 ， 因为 
前 者 是 在 计算 机 中 实际 用 来 产生 颜色 的 值 。 图 6.9 (a) 说明， 简单 地 把 三 幅 独 立 的 分 量 图 像 送 入 彩色 监视 
器 ， 可 观察 一 幅 横 截 面 图 像 。 在 分 量 图 像 中 ，0 代表 黑色 ，255 代表 白色 (注意 这 些 是 灰 度 级 图 像 )。 最 
后 ， 图 6.9(b) 显示 了 以 同样 方式 生成 的 图 6.8 中 立方 体 的 3 个 隐藏 面 。 

值得 注意 的 是 ， 获 取 一 幅 彩色 图 像 基本 上 是 图 6.9 所 示 的 相反 过 程 。 使 用 分 别 对 红 、 绿 、 蓝 敏感 的 3 
个 滤 色 片 可 获取 一 幅 彩 色 图 像 。 当 我 们 采用 配备 有 这 些 滤 色 片 之 一 的 单 色 摄像 机 观察 彩色 场景 时 ,结果 是 一 
幅 单 色 图 像 ， 其 亮度 与 滤 色 片 的 响应 成 正比 。 用 每 个 滤 色 片 重 复 这 一 过 程 ， 可 产生 三 幅 单 色 图 像 ， 这 些 图 像 
就 是 彩色 场景 的 RGB 分 量 图 像 (实际 上 ， RGB 彩色 图 像 传感器 通常 将 这 一 过 程 集成 在 一 个 装置 中 ) 。 很 明显 ， 
以 图 6.9 (a) 所 示 的 形式 显示 这 3 幅 RGB 分 量 图 像 ， 就 会 产生 原始 彩色 场景 的 RGB 彩色 复 现 。 


a 
b 






RGB 
彩色 监视 器 I> 








(R=0) (G = 0) (B =0) 
图 69 (a) 生成 彩色 剖面 (127, G, BHI RGB EMR; (b) 图 6.8 RE AMALA 3 个 隐藏 面 


虽然 高 端 显示 卡 和 监视 器 提供 24 比特 RGB 图 像 的 合理 彩色 再 现 ， 但 今天 所 用 的 许多 系统 仍 限 

fey 种 颜色 。 另 外 ， 有 许多 应 用 ,使 用 几 百 种 以 上 的 颜色 没有 意义 ， 而 有 时 只 用 几 种 颜色 。6.3 节 

论 的 伪 彩 色 图 像 处 理 技术 就 提供 了 这 种 情况 的 一 个 较 好 例子 。 当 前 应 用 给 定 的 各 种 系统 中 ， 有 一 

多 色 子 系统 值得 考虑 ， 其 合理 且 与 观察 者 无 关 的 硬件 性 能 是 很 重要 的 。 这 种 色彩 子 集 称 为 稳定 

RGB ERA, 或 称 为 全 系统 稳定 色 集 合 。 在 互联 网 应 用 中 , 这 种 色彩 子 集 称 为 稳定 Web 色 或 稳定 浏 
览 器 色 。 

假定 256 种 颜色 是 最 小 颜色 数 ， 这 些 颜色 可 用 任何 能 显示 所 希望 彩色 的 系统 真实 再 现 ， 那 么 

使 用 可 接受 的 标准 符号 来 表示 这 些 颜色 是 很 有 用 的 。 已 知 256 种 颜色 中 的 40 种 颜色 可 被 各 种 操作 
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系统 进行 不 同 的 处 理 ， 剩 下 的 216 种 颜色 是 多 数 系统 通用 的 。 这 216 种 颜色 已 成 为 事实 上 的 稳定 
色 ， 特别 是 在 互联 网 中 的 应 用 。 无 论 在 何 时 应 用 ,希望 大 多 数 人 观察 到 的 颜色 都 一 样 。 

如 以 前 一 样 ,216 种 稳定 色 中 的 每 种 都 可 以 由 3 个 RGB 值 形成 ,但 每 个 值 只 能 是 0, 51, 102, 153, 204 
或 255。 这 样 ， 这 些 RGB 三 元 组 数值 就 可 提供 (6) = 216 种 可 能 的 值 (注意 所 有 值 都 可 被 3 整除 ) 。 通 
常 这 些 值 可 用 十 六 进 制 数 来 表示 ， 如 表 6.1 所 示 。 回 顾 可 知 ， 十 六 进 制 数 0, 1, 2,…, 9, A, B, C, D, E, F 
对 应 十 进 制 数 0, 1, 2,…, 9, 10, 11, 12, 13, 14, 15。 还 可 以 表示 为 (0)ie = (0000), 和 (F) 6 = (1111), 例如， 
(FF)i6=(255)io=(11111111),， 并 且 我 们 可 以 看 到 ， 两 个 十 六 进 制 数 构成 一 个 8 比特 字 节 。 


表 6.1 稳定 色 中 每 个 RGB 分 量 的 有 效 值 





因为 要 取 3 个 数 来 形成 RGB 彩色 , 每 种 稳定 色 由 表 6.1 中 的 3 个 两 位 十 六 进 制 数 形成 。 例 如 , 最 
纯净 的 红色 是 FF0000。 值 000000 和 FFFFFF 分 别 表示 黑色 和 白色。 记 住 ， 使 用 更 为 熟悉 的 十 进 制 表 
示 可 得 到 相同 的 结果 。 例 如 ， 以 十 进 制 表 示 的 最 亮 红 色 为 R=255(FF) 和 G=B=0。 

图 6.10 (a) 显示 了 按 RGB 的 值 降序 排列 的 216 种 稳定 色 。 第 一 行 左 上 和 角 方块 的 值 为 FFFFFF (A). 
其 右 侧 方块 的 值 为 FFFFCC， 第 三 个 方块 的 值 为 FFFF99， 等 等 。 同 一 阵列 第 二 行 的 值 是 FFCCFF, 
FFCCCC, FFCC99， 等 等 。 该 阵列 中 最 后 一 个 方块 的 值 为 FF0000( 可 能 是 最 亮 的 红色 ) 。 刚 考察 过 的 阵 
列 右 侧 的 第 二 个 阵列 的 值 由 CCEFFF 开始 ， 并 以 相同 的 方式 出 现 ， 剩 下 的 4 个 阵列 也 以 同样 的 方式 出 
现 。 最 后 一 个 阵列 的 最 后 一 个 方块 ( 右 下 方 ) 的 值 为 000000( 黑 ) 。 注 意 ， 不 是 所 有 可 能 的 8 比特 灰色 都 
包含 在 216 种 稳定 色 中 ， 这 一 点 很 重要 。 图 6.10(b) 显示 了 256 色 RGB 系统 中 所 有 可 能 灰色 的 十 六 进 
制 代码 。 这些 值 的 一 部 分 在 稳定 色 集 的 外 面 , 但 可 被 多 数 显 示 系 统 ( 根 据 它们 的 相对 亮度 ) 适 当地 表示 。 
来 自 稳定 色 组 的 灰 度 (KKKKKK)i6,K=0,3,6,9, C, F 在 图 6.10(b) 中 以 下 画 线 形式 显示 。 





000 
11111 
2222 
333333 
§55555 
666666 
888888 
3999 
CCCCCC 





444444 
777777 





See 


图 6.10 (a)216 种 稳定 RGB 色 ; (b)256 色 RGB 系统 中 的 所 有 灰 度 (部 分 稳定 色 组 的 灰 度 以 下 画 线 的 形式 显示 ) 
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图 6.11 显示 了 RGB 稳定 色 立 方 体 。 与 图 6.8 所 示 的 实心 全 彩色 立方 
体 不 同 , 图 6.11 中 的 立方 体 仅 在 表面 存在 有 效 的 颜色 。 如 图 6.10 (a) 所 示 ， 
每 个 平面 都 有 36 种 颜色 , 所 以 稳定 色 立 方 体 的 整个 表面 被 216 种 不 同 的 
颜色 所 覆盖 ， 而 这 正 是 我 们 所 期 望 的 。 


6.2.2 CMY 和 CMYK 彩色 模型 


如 6.1 节 中 指出 的 那样 , 青色 、 深 红色 和 黄色 是 光 的 二 次 色 , 换 句 话说 ， 
它们 是 颜料 的 原色 。 例如 ， 当 青色 颜料 涂 覆 的 表面 用 白光 照射 时 , 该 表面 将 
不 反射 红 光 。 也 就 是 说 ， 青 色 从 反射 的 白光 中 减 去 红 光 ， 白 光 本 身 由 等 量 的 红 光 、 绿 光 和 蓝光 组 成 。 

大 多 数 在 纸 上 沉积 彩色 颜料 的 设备 ， 如 彩色 打印 机 和 复印 机 ， 要 求 输入 CMY 数据 或 在 内 部 进行 
RGB 到 CMY 的 转换 。 这 一 转换 是 使 用 下 面 这 个 简单 的 操作 执行 的 : 


Ç 





图 6.11 RGB 稳定 色 立 方 体 


1 
=|1 
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这 里 再 次 假设 所 有 的 彩色 值 都 归 一 化 到 了 区 间 [0, 1] 内 。 式 (6.2-1) 表明 涂 有 青色 颜料 的 表面 所 反射 的 
光 中 不 包含 红色 ( 即 公 式 中 C=1 一 R)。 类似 地 , 纯 深 红色 不 反射 绿色 , 纯 黄 色 不 反射 蓝 色 。 式 (6.2-1) 
还 揭示 RGB 值 可 以 很 容易 地 通过 1 减 去 CMY 值 从 CMY 集中 得 到 。 正 如 早 些 时 候 指 出 的 那样 ， 在 
图 像 处 理 中 , 这 种 彩色 模型 主要 用 于 产生 硬 拷 贝 输出 , 因此 从 CMY 到 RGB 的 反 向 操作 通常 没有 实 

根据 图 6.4， 等 量 的 颜料 原色 ， 即 青色 、 深 红色 和 黄色 ， 可 以 生成 黑色 。 实 际 土 ， 为 打印 目的 组 
合 的 这 些 颜色 所 产生 的 黑色 是 不 纯 的 。 因 此 ,为 了 生成 真正 的 黑色 ( 即 在 打印 中 起 主要 作用 的 颜色 ) ， 加 
人 了 第 4 种 颜色 一 一 黑色 ,提出 了 CMYK 彩色 模型 。 这 样 ， 当 出 版 商 提 到 “四 色 打 印 ” 时 ， 指 的 就 是 
CMY 彩色 模型 的 三 种 原色 再 加 上 黑色 。 


6.2.3 HSI 彩色 模型 


如 我 们 见 到 的 那样 ,在 RGB 模型 和 CMY 模型 中 创建 颜色 并 从 一 种 模型 转换 到 另 一 种 模型 的 过 程 
很 简单 。 如 上 所 述 ， 这 些 彩 色 系 统 对 于 硬件 实现 很 理想 。 另 外 ，RGB 系统 能 很 好 地 吻合 人 眼 强烈 感知 
红 、 绿 、 蓝 三 原色 的 事实 。 和 遗憾 的 是 ，RGB 模型 、CMY 模型 和 其 他 类 似 的 彩色 模型 都 无 法 很 好 地 适应 
人 类 实际 上 解释 的 颜色 。 例如， 使 用 给 定 组 成 颜色 的 每 种 原色 的 百分比 不 能 给 出 一 辆 汽车 的 颜色 ， 此 
外 ， 我 们 不 认为 彩色 图 像 是 由 3 幅 原 色 图 像 混 合 形成 的 单 幅 图 像 。 

观察 彩色 物体 时 ,我 们 用 其 色调 、 饱 和 度 和 亮度 来 描述 这 个 物体 。 回 顾 6.1 的 讨论 ， 色 调 描述 
的 是 一 种 纯色 ( 纯 黄色 、 纯 橙色 或 纯 红色 ) 的 颜色 属性 , 而 饱和 度 是 一 种 纯色 被 白光 稀释 的 程度 的 度量 。 
亮度 是 一 个 主观 描述 子 ， 实 际 上 它 是 不 可 度量 的 。 它 体现 了 无 色 的 强度 概念 ， 并且 是 描述 彩色 感觉 的 
关键 因子 之 一 。 我 们 清楚 地 知道 强度 ( 灰 度 级 ) 是 单 色 图 像 最 有 用 的 描述 子 。 很 明显 ， 这 个 量 是 可 度量 
的 ， 并 很 容易 解释 。 我 们 即将 提出 的 模型 称 为 HS (色调 、 饱 和 度 和 强度 ) 彩色 模型 ， 该 模型 可 在 彩色 
图 像 中 从 携带 的 彩色 信息 (色调 和 饱和 度 ) 中 消去 强度 分 量 的 影响 。 因 此 ， HSI 模 型 是 开发 基于 彩色 描 
述 的 图 像 处 理 算法 的 理想 工具 ， 这 种 彩色 描述 对 人 来 说 是 自然 且 直 观 的 ， 毕 竞 人 才 是 这 些 算法 的 开发 
者 和 使 用 者 。 因 此 ， 我 们 可 以 概括 说 明 如 下 : RGB 对 于 图 像 颜色 生成 来 说 是 理想 的 (如 用 彩色 摄像 机 
获取 图 像 , 或 在 监视 器 屏幕 上 显示 图 像 ), 但 在 用 于 颜色 描述 时 则 有 许多 限制 。 下 面 提供 了 一 种 这 样 做 〖 
的 有 效 方法 。 
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如 例 6.1 中 讨论 的 那样 , RGB 彩色 图 像 可 视 为 3 幅 单 色 亮度 图 像 (表示 红色 、 绿 色 和 蓝 色 ) ,因此 ， 
我 们 应 能 从 一 幅 RGB 图 像 中 提取 出 强度 。 如 果 使 用 图 6.7 中 的 彩色 立方 体 , 让 白色 顶点 (1, 1, 1) 在 黑色 
顶点 (0, 0, 0) 上 方 直接 面 对 它 ， 如 图 6.12 (a) 所 示 ， 那 么 这 一 点 会 更 加 清楚 。 联 系 图 6.7 可 知 ， 强 度 ( 灰 度 
级 ) 是 沿 连接 这 两 个 顶点 的 直线 分 布 的 。 如 图 6.12 中 的 排列 所 示 ， 连 接 黑 色 顶 点 和 白色 顶点 的 直线 OK 
度 轴 ) 是 垂直 的 。 这 样 ， 如 果 我 们 要 确定 图 6.12 中 任何 彩色 点 的 强度 分 量 ,可 以 简单 地 找到 通过 一 个 垂 
直 于 强度 轴 并 包含 该 彩色 点 的 平面 ， 然 后 找到 这 个 平面 与 强度 轴 的 交点 ， 交 点 的 值 即 为 区 间 [0, 1] 内 的 
强度 值 。 稍 加 思考 , 我 们 还 注意 到 , 一 种 颜色 的 饱和 度 (纯度 ) 以 强度 轴 的 距离 为 函数 而 增 大 。 事 实 上 ， 
强度 轴 上 点 的 饱和 度 为 零 ， 事 实证 明 沿 着 这 条 轴线 的 所 有 点 都 是 灰 度 。 

ab 


白色 





图 6.12 RGB 模型 和 HSI 模型 间 的 概念 关系 


要 解 如 何 从 给 定 的 RGB 点 来 确定 色调 ,我 们 考虑 图 6.12 (b) ， 图 中 显示 了 由 3 个 点 ( 黑 、 白 和 青 ) 
定义 的 一 个 平面 。 黑 点 和 白 点 包含 在 平面 内 的 事实 告诉 我 们 ， 强 度 轴 也 包含 在 这 个 平面 内 。 进 一 步 ， 
我 们 看 到 , 包含 在 由 强度 轴 和 立方 体 边界 定义 的 平面 段 内 的 所 有 点 , 都 有 相同 的 色调 (在 这 种 情形 下 为 
青色 ) 。 回 顾 6.1 节 可 得 到 相同 的 结论 ， 即 所 有 颜色 都 是 由 位 于 这 些 颜 色 定 义 的 三 角形 中 的 3 种 颜色 产 
生 的 。 如 果 这 些 点 中 的 两 点 是 黑 点 和 白 点 ， 第 三 点 是 一 个 彩色 点 ， 那 么 三 角形 上 的 所 有 点 都 有 相同 的 
色调 ， 因 为 黑 分 量 和 白 分 量 不 能 改变 色调 (当然 ， 这 个 三 角形 中 的 点 的 强度 和 饱和 度 是 不 同 的 ) 。 关 于 
垂直 强度 轴 旋 转 阴 影 平 面 ， 可 得 到 不 同 的 色调 。 由 这 些 概 念 可 以 得 出 这 样 的 结论 : 形成 HSI 空间 所 要 
求 的 色调 、 饱 和 度 和 强度 值 可 由 RGB 彩色 立方 体 得 到 。 也 就 是 说 ， 通 过 计算 前 面 讨论 中 描述 和 推导 
的 几何 公式 ,可 将 任何 RGB 点 转换 为 相应 的 HSI 彩色 模型 中 的 点 。 

关于 图 6.12 中 的 立方 体 结构 及 其 对 应 的 HSI 彩色 空间 ， 要 记 住 的 一 个 关键 点 是 ，HSI 空间 由 一 个 
垂直 强度 轴 和 位 于 与 该 轴 垂 直 的 平面 内 的 彩色 点 的 轨迹 表示 。 当 平面 沿 强度 轴 上 下 移动 时 ， 由 每 个 平 
面 与 立方 体 表 面 构成 的 横 截 面 定义 的 边界 不 是 三 角形 就 是 六 边 形 。 这 种 情况 如 图 6.13(a) 所 示 ， 沿 其 灰 
度 轴 向 下 看 ， 这 一 点 就 会 清楚 得 多 。 在 这 个 平面 中 ,我 们 可 以 看 到 原色 按 120° 分 隔 ， 二 次 色 与 原色 相 
m 60"， 这 意味 着 二 次 色 之 间 也 相隔 120"。 图 6.13 (b) 显示 了 相同 的 六 边 形 和 任意 一 个 彩色 点 (显示 为 
一 个 点 ) 。 该 点 的 色调 由 来 自 某 参考 点 的 一 个 角度 决定 。 通 常 (并非 总 是 如 此 ) ， 与 红 轴 的 O° 角 指 定 为 
0 色调， 从 这 里 开始 色调 逆 时 针 增 长 。 饱 和 度 ( 距 垂直 轴 间 的 距离 ) 是 从 原点 到 该 点 的 向 量 长 度 。 注 意 ， 
原点 是 由 该 彩色 平面 的 横 截 面 与 垂直 强度 轴 来 定义 的 。HSI 彩色 空间 的 重要 分 量 是 垂直 强度 轴 、 到 一 
个 彩色 点 的 向 量 长 度 和 该 向 量 与 红 轴 的 夹 角 。 因 此 ， 如 图 6.13 (c) 和 图 6.13 (d) 所 示 ，HSI 平面 以 刚刚 
讨论 的 六 边 形 、 三 角形 ， 甚 至 一 个 圆 形 的 形式 出 现 也 很 常见 。 实 际 上 选择 什么 形状 无 关 紧要 ， 因 为 这 
些 形状 中 的 任何 一 个 都 可 以 通过 几何 变换 转换 为 其 他 两 种 形状 。 图 6.14 显示 了 基于 彩色 三 角形 和 圆 形 
的 HSI 模 型 。 
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图 6.13 HSI 彩色 模型 中 的 色调 和 饱和 度 。 黑 点 是 一 个 任意 彩色 点 。 与 红 轴 的 夹 角 给 出 了 色调 ， 向 
量 的 长 度 是 饱和 度 。 这 些 平面 中 的 所 有 彩色 的 强度 由 垂直 强度 轴 上 的 平面 的 位 置 给 出 





图 6.14 基于 (a) 三 角形 和 (b) 圆 形 彩色 平面 的 HSI 彩 色 模型 。 三 角形 和 圆 形 平面 垂直 于 垂 强度 轴 
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从 RGB 到 HSI 的 彩色 转换 
给 定 一 幅 RGB 彩色 格式 的 图 像 ， 每 个 RGB 像素 的 五 分 量 可 用 下 由 RGB 到 HSI 或 从 HSI 到 RGB 





式 得 到 : 的 计算 是 逐个 像素 执行 的 。 为 表述 清 
Ba 晰 ,我 们 省 略 了 转换 公式 对 C, y) OE 
pz | a (62-37 1% 
360-8, B>G 
sth, 
1 R-G)+(R —B) 
@ = arc cos Pe st gs 
| [(R-G)’ +(R-B)(G— By} 
饱和 度 分 量 由 下 式 给 出 : 
3 j 
=] Go R G,B)| (6.2-3) 
最 后 ， 强 度 分 量 由 下 式 给 出 : 
I =7(R+G+B) (6.2-4) 


如 图 6.13 中 指出 的 那样 ， 假 定 RGB 值 已 归 一 化 到 区 间 [0, 1] 内 ， 并 且 和 角度 9 根据 HSI 空间 的 红 轴 来 

度量 。 色调 可 以 用 式 (6.2-2) 得 到 的 所 有 值 除 以 360” 归 一 化 到 区 间 [0, 1] 内 。 如 果 给 定 的 RGB 值 在 区 

间 [0, 1] 内 ， 则 其 他 两 个 HSI 分 量 也 已 在 区 间 [0, 1A. AEF ROB 和 HSsI 之 间 及 HSl 
式 (6.2-2) 到 式 (6.2-4) 中 的 结果 可 由 图 6.12 和 图 6.13 所 示 的 几何 关 | 和 RGB 之 间 的 转换 公式 的 详细 推导 

系 推 得 。 这 一 推导 很 烦琐 ， 而 且 对 现在 的 讨论 没有 太 大 意义 。 对 这 些 | 过程， 请 读者 参阅 本 书 网 站 上 的 

公式 的 证 明 及 对 下 面 的 HSI 至 RGB 转换 结果 感 兴 趣 的 读者 , 可 以 参考 | Tonal HP. 

本 书 的 参考 文献 或 网 站 。 


从 HSI 到 RGB 的 彩色 转换 


对 于 [0, 1] 内 的 HSI 值 , 现在 我 们 想 要 在 相同 的 值 域 找到 对 应 的 RGB 值 。 可 用 的 公式 取决 于 五 的 
值 。 在 原色 分 隔 中 有 3 个 相隔 120* 的 扇 区 ( 见 图 6.13) 。 RAIA A FELL 360* 开 始 , 这 时 的 色调 值 回 到 原 
来 的 区 间 [0°, 360°] 9. 

RG (0° < 及 < 120°): 4A MAAR PI, RGB 分 量 由 以 下 公式 给 出 : 





B=I(1-S) (6.2-5) 
R= 由 | (6.2-6) 
cos(60°— H) 
G=31-(R+B) (6.2-7) 
GB A X(120°< H< 240°): 如 果 给 定 的 五 值 在 该 户 区 中 ， 则 首先 从 五 中 减 去 120°, B 
H =H-120° (6.2-8) 


D 在 该 表达 式 中 加 一 个 较 小 的 数 可 避免 在 R= G = 8B 时 被 零 除 的 情形 ( 即 9 为 90? 的 情形 ) 。 注 意 ， 当 所 有 的 RGB 分 量 相等 时 ， 由 
式 (6.2-3) 可 得 出 S$=0。 此 外 ， 式 (6.2-5) 至 式 (6.2-7) 中 的 由 HSI 至 RGB 的 转换 将 给 出 =G= B=1， 这 是 我 们 期 望 的 结果 ， 因 
为 当 R=G=8B 时 ,我 们 处 理 的 图 像 是 灰 度 级 图 像 。 
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则 RGB 分 量 为 


R=I1(1-S) (6.2-9) 
asrli see | (6.2-10) 
cos(60°— H) 

B=31-(R+G) (6.2-11) 

BR JX (240°< H< 360°): Ba, WEAKER, WA H PRAE 240°, B 
H =H -240° (6.2-12) 

则 RGB 分 量 为 
G=I(1-S) (6.2-13) 
r=} | (6.2-14) 
cos(60° — H) 

R=31-(G+B) (6.2-15) 


这 些 公 式 在 图 像 处 理 中 的 用 法 将 在 下 面 各 节 加 以 讨论 。 


eZ 对 应 于 RGB 彩色 立方 体 图 像 的 HSI 值 。 

图 6.15 显 示 了 图 6.8 中 所 示 RGB 值 的 色调 、 饱 和 度 和 强度 图 像 。 图 6 15(a) 是 色调 图 像 ， 其 最 大 的 特点 
是 立方 体 前 ( 红 ) 平 面 沿 45" 线 的 值 是 不 连续 的 。 为 了 解 不 连续 的 原因 ， 可 参见 图 6.8， 从 立方 体 的 红色 项 点 
到 白色 顶点 画 一 条 线 ， 并 在 这 条 线 的 中 间 选 择 一 点 。 从 该 点 开始 ， 向 环绕 立方 体 一 周 直到 回 到 开始 点 画 
一 条 轨迹 。 在 该 路 径 中 出 现 的 主要 颜色 是 黄色 、 绿色 、 青色 , 蓝 色 、 深 红色 、 黑 色 直至 红色 。 根 据 图 6.13， 
沿 该 路 径 的 色调 值 应 该 从 0? 增 加 到 360”( 即 从 色调 的 最 低 可 能 值 到 最 高 可 能 值 ) 。 这 正好 如 图 6.15 (a) 所 示 的 
那样 ， 因 为 在 灰 度 级 中 最 低 值 代表 黑色 ， 最 高 值 代 表白 色 。 事 实 上 ， cain sie nines ee Ait 
(0, 1] 内 ， 然 后 被 缩放 到 8 比特 ， 即 在 显示 时 转换 到 了 区 间 [0, 255] 内 。 

有 有 图 6.15 b) 中 ， 饱和 度 图 像 显 示 了 从 暗 值 逐 渐 向 RGB 立方 的 白 顶 点 的 过 渡 ， 颜 色 越 来 越 少 ， 饱 和 度 
越 来 越 低 。 最 后 ， 图 6.15 (c) 所 示 强 度 图 像 中 的 每 个 像素 值 是 图 6.8 中 相应 像素 处 RGB 值 的 平均 。 
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图 6.15 图 6.8 中 图 像 的 HSI 分 量 : (a) 色 调 图 像 ，(b) 饱 和 度 图 像 ，(c) 强 度 图 像 
处 理 HSI 分 量 图 像 


在 下 面 的 讨论 中 ， 我 们 考察 处 理 HSI 分 量 图 像 的 几 种 简单 技术 ， 以 便 帮助 你 熟悉 这 些 分 量 并 加 
深 对 HSI 彩色 模型 的 理解 。 图 6.16 (a) 显示 了 一 幅 由 RGB 原色 和 二 次 色 组 成 的 图 像 。 图 6.16 (b) 
到 图 6.16(d) 显示 了 这 幅 图 像 的 已 8S 和 了 分 量 图 像 ， 这 些 图 像 是 用 式 (6.2-2) 到 式 (6.2-4) 产 生 的 。 回 顾 a8 
本 节 早 些 时 候 的 讨论 , 图 6.16(b) 中 的 灰 度 值 对 应 于 角度 ; 例如 , 因为 红色 对 应 于 O°, 所 以 图 6.16 (a) 
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中 的 红 区 域 被 映射 到 色调 图 像 中 的 一 个 黑色 区 域 。 类 似 地 ， 图 6.16 (c) 中 的 灰 度 级 对 应 于 饱和 度 (为 了 
显示 ， 它 们 被 放大 到 [0, 255]) ， 图 6.16(q) 中 的 灰 度 级 是 平均 强度 

要 在 RGB 图 像 中 更 改 任何 区 域 的 个 别 颜 色 ， 我 们 可 以 改变 图 6.16 Biv PI AY 
值 。 然 后 用 式 (6.2-5) 到 式 (6.2-15) 中 说 明 的 步骤 ; 将 新 的 H 图像 和 没有 变化 的 S 图 像 与 1 图 像 一 起 变 
换 回 RGB 图 像 。 要 改变 任何 区 域 中 颜色 的 饱和 度 (纯度 ) ， PRY 4 HSI 空间 改变 饱和 度 之 外 ， 可 采 
用 相同 的 步骤 。 类 似 的 方法 可 用 于 更 改 任何 区 域 的 平均 强度 。 当 然 ， 这 些 改变 可 同时 进行 。 例 如 ， 
图 6.17 (a) 中 的 图 像 是 通过 将 对 应 于 图 6.16 (b) 中 的 蓝 色 、 绿色 区 域 的 像素 变 为 0 得 到 的 。 在 图 6.17 (b) 
中 ,我 们 将 图 6.16(c) 的 分 量 图 像 S 中 的 青色 区 域 的 饱和 度 降 低 一 半 。 在 图 6.17(c) 中 ,我 们 把 图 6.16 (d) 
所 示 强 度 图 像 中 心 的 白色 区 域 的 强度 降低 一 半 。 把 改进 后 的 HSI 图 像 转换 回 RGB 彩色 空间 的 结果 显 
示 在 图 6.17(d) 中 。 如 预期 的 那样 , 在 这 些 图 中 我 们 看 到 ， 所 有 圆 形 的 外 部 区 域 现在 是 红色 的 ， 青 色 区 
域 的 纯度 降低 了 , 中 心 区 域 变 成 了 灰色 而 不 再 是 白色 。 显然 这 些 结果 很 简单 , 但 却 清楚 地 显示 出 了 HSI 
模型 独立 控制 色调 、 饱 和 度 和 强度 的 能 力 。 当 描述 彩色 时 ， 我 们 会 十 分 熟悉 这 些 量 。 


vy 


图 6.16 (a)RGB 图 像 及 其 对 应 的 HSI 图 像 的 分 图 6.17 (a)~(e) 修 改 后 的 HSI 分 量 图 像 ，(d) 最 
fit; (b) 色 调 ; (c) 饱 和 度 ; (a) 强度 终 的 RGB 图 像 ( 原 始 的 HSI 图 像 见 图 6.16) 





6.3” 伪 彩色 图 像 处 理 


伪 彩 色 (也 称 为 假 彩色 ) 图像 处 理 是 指 基 于 一 种 指定 的 规则 对 灰 度 值 赋 以 颜色 的 处 理 。 术 语 伪 彩 色 
或 假 彩色 用 于 区 分 对 单 色 图 像 赋 予 彩色 的 处 理 和 与 真 彩色 图 像 相 关 的 处 理 , 真 彩色 图 像 是 在 6.4 节 中 开 
始 讨 论 的 主题 。 伪 彩色 的 主要 应 用 是 人 目 视 观察 和 解释 单 幅 图 像 或 序列 图 像 中 的 灰 度 级 事件 。 正 如 本 
章 开 始 时 指出 的 那样 ， 利 用 彩色 的 主要 动力 之 一 是 人 类 可 以 辨别 几 千 种 色调 和 强度 ， 而 相 比 之 下 只 能 
辨别 20 多 种 灰 度 。 


6.3.1 REDE 


灰 度 分 层 (有 时 称 为 密度 分 层 ) 和 彩色 编码 技术 是 伪 彩 色 图 像 处 理 的 最 简单 的 例子 之 一 。 如 果 一 幅 
图 像 被 描述 为 三 维 函数 [ 见 图 2.18 (a) ]， 则 分 层 方法 可 视 为 放置 一 些 平行 于 该 图 像 的 坐标 平面 的 平面 ， 
然后 ， 每 个 平面 在 相交 的 区 域 中 “切割 ”图 像 函数 。 图 6.18 显示 了 使 用 位 于 f(x,y) = 上 4 处 的 一 个 平面 
把 该 图 像 函数 切割 为 两 部 分 的 例子 。 


D 灰 度 分 层 在 有 些 译 著 中 也 称 为 灰 度 分 割 一 一 译 者 注 
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f(x, y) 
REM 





图 6.18 灰 度 分 层 技术 的 几何 解释 


如 果 对 图 6.18 中 平面 的 每 一 侧 赋 以 不 同 的 颜色 ,平面 上 面 的 任何 灰 度 级 的 像素 将 编码 成 一 种 彩色 ， 
该 平面 之 下 的 任何 像素 将 编码 成 男 一 种 颜色 。 位 于 平面 上 的 灰 度 级 本 身 被 任意 赋 以 两 种 彩色 之 一 。 结 
果 是 一 幅 只 有 两 种 颜色 的 图 像 ， 对 应 的 外 观 可 通过 沿 灰 度 轴 上 下 移动 这 个 切割 平面 来 控制 。 

通常 ， 该 技术 可 总 结 如 下 : 令 [0, L-1] 表 示 灰 度 级 ， 令 代表 黑色 [f(x,y) = 0 ]， 并 令 1 代表 白 
E [fey b 假定 垂直 于 灰 度 轴 的 已 个 平面 定义 为 灰 度 级 h, 5,…, lp。 然后 , 假定 0<P<L-1， 
P 个 平面 将 灰 度 分 为 P+ 1 个 区 间 Vi, Vos, Vp+1。 灰 度 级 到 彩色 赋值 根据 如 下 关系 进行 : 


fæ f(x,y) eR (6.3-1) 
式 中 ci 是 与 第 k 个 灰 度 区 间 所 有 关 的 颜色 , 所 由 位 于 1=k-1 
和 /1= 大 处 的 分 割 平面 定义 。 å 


平面 的 概念 对 于 灰 度 分 层 技术 的 几何 解释 很 有 用 ,图 6.19 | 
给 出 了 另 一 种 解释 ， 它 定义 了 如 图 6.18 所 示 的 相同 映射 。 根 


据 图 6.19 中 显示 的 映射 函数 ， 任 何 输入 的 灰 度 级 根据 其 是 位 a 
于 4 值 的 上 面 还 是 下 面 而 赋予 两 种 颜色 之 一 。 当 用 更 多 的 灰 度 west 


级 时 ， 映 射 函数 采用 一 种 阶梯 形式 。 图 619 灰 度 分 层 技术 的 另 一 种 表示 


4 - 






在 前 面 这 个 简单 的 例子 中 ， 灰 度 被 分 为 几 个 区 间 ， 且 每 个 区 域 赋予 了 不 同 的 颜色 ， 而 未 考虑 到 
图 像 中 灰 度 级 的 意义 。 在 这 种 情况 下 ， 感 兴趣 的 只 是 简单 地 观察 构成 图 像 的 不 同 灰 度 级 。 当 灰 度 级 细 
分 基于 图 像 的 物理 特性 时 ， 灰 度 分 层 就 会 有 很 大 的 意义 并 起 重要 作用 。 例 如 ， 图 621(a) BRR AAR 


纹 和 孔隙 (水平 通过 图 像 中 部 的 亮 的 白色 条 痕 ) 的 焊接 物 X 光 图 像 (水 平 暗 区 ) 。 我 们 知道 ， 当 焊接 物 中 |? 


有 裂纹 和 孔隙 时 ，X 射线 的 全 部 强度 都 会 通过 物体 ， 使 位 于 物体 另 一 边 的 成 像 传感器 他 和 ( 见 23 节 ) 。 ba 
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这 样 ， 来 自 这 一 系统 的 8 比特 图 像 中 的 图 像 灰 度 值 为 255， 进 而 自动 地 意味 着 焊接 有 问题 。 如 果 人 是 
分 析 的 最 终 判断 者 ， 并 采用 人 工 处 理 来 检测 焊接 的 质量 (直至 今天 ， 这 仍 是 常用 的 工序 ) ， 那 么 将 一 
种 颜色 赋 给 255 这 个 灰 度 级 、 而 将 另 一 种 颜色 赋 给 所 有 其 他 灰 度 级 的 简单 彩色 编码 , 会 极 大 地 简化 检 
测 者 的 工作 。 图 6.21 (b) 显示 了 这 一 结果 。 如 果 以 图 -6.21 (b) 而 非 图 6.21 (a) 的 形式 来 显示 图 像 ,“ 人 
的 误 识 率 将 降低 ”这 一 结论 二 良 置疑 。 换 名 话说， 如 果 所 寻找 的 确切 灰 度 值 或 值 域 是 已 知 的 ， 则 灰 
度 分 层 在 可 视 化 方面 是 简单 上 且 有 力 的 辅助 手段 ， 涉 及 大 量 图 像 时 更 是 如 此 。 下 面 是 一 个 更 为 复杂 的 
例子 





图 6.20 (a) Picker 甲状 腺 模型 的 单 色 图 像 ，(b) 密度 分 层 为 8 种 颜色 的 结果 ( 原 图 像 
由 美国 Oak Ridge 国家 实验 室 仪 器 与 控制 分 部 的 工 L. Blankenship 博士 提供 ) 





图 6.21 (a) 焊 颖 的 单 色 X 射线 图 像 ;， (b) 彩色 编码 的 结果 ( 原 图 像 由 X-TEK 系统 有 限 公司 提供 ) 


例 6.4 使 用 彩色 突出 降雨 量 。 

测量 地 球 上 各 区 域 (尤其 是 热带 区 域 ) 的 降雨 量 ， 在 与 环境 有 关 的 各 种 应 用 中 很 重要 。 用 地 面 传感器 准 
确 测量 降雨 量 很 困难 ， 而 且 代价 高 昂 ， 得 到 总 雨量 图 更 为 困难 ， 因 为 重要 的 降雨 区 都 在 海洋 上 。 获 得 降雨 
量 图 的 一 种 方法 是 使 用 卫星 。TRMM (Tropical Rainfall Measuring Mission ， 热 带 降雨 量 测量 任务 ) 卫星 使 用 
为 检测 降雨 而 特殊 设计 的 3 个 传感器 : 一 个 降雨 雷达 、 一 个 微波 成 像 仪 和 一 个 可 见 光 及 红外 扫描 仪 (关于 
图 像 传 感 模式 ， 请 参阅 1.3 节 和 2.3 节 ) 。 

来 自 各 个 雨量 传感器 的 结果 经 处 理 后 ， 得 出 传感器 监视 区 域 在 给 定时 间 段 的 平均 降雨 量 的 估计 。 从 
这 些 估 计生 成 灰 度 值 直接 对 应 于 降雨 量 的 灰 度 图 像 并 不 困难 ， 每 个 像素 代表 自然 的 陆地 面积 ， 其 大 小 取 
决 于 传感器 的 分 辨 率 。 这 样 的 一 幅 灰 度 图 像 示 于 图 6.22 (a) ， 其 中 ， 由 卫星 监视 的 区 域 是 在 图 像 中 间 的 三 
分 之 一 处 稍 亮 一 些 的 水 平 带 ( 即 热带 区 域 ) 。 在 这 个 特殊 的 例子 中 ， 降 雨 值 是 三 年 时 间 内 的 月 平均 值 ( 单 
位 为 英寸 ) 。 
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对 于 降雨 模式 ， 目 测 这 些 图 像 也 是 十 分 困难 的 ,甚至 是 不 可 能 的 。 然 而 ,假设 使 用 图 6.22 (b) 所 示 的 彩 
色 对 0 到 255 的 灰 度 级 编码 ， 那 么 趋 于 蓝 色 的 值 意味 着 低 降 雨量 ， 相 反 则 为 红色 。 注 意 ， 标 度 终止 于 纯 红 
色 处 , 表示 降雨 量 大 于 20 英寸 , 图 6.22(c) 显示 了 使 用 刚才 讨论 的 彩色 映射 对 灰 度 图 像 进 行 彩色 编码 的 结果 。 
如 图 6.22(c) 和 图 6.22(d) 的 放大 区 域 所 示 ， 这 些 结果 更 易于 解释 。 另 外 ， 除 了 提供 全 球 覆 盖 外 ， 这 种 类 型 的 
数据 允许 气象 工作 者 使 用 比 以 往 更 精确 的 方法 来 标定 地 面 的 雨量 监控 系统 。 








6.3.2 ” 灰 度 到 彩色 的 变换 


与 前 一 节 讨 论 的 简单 分 层 技术 相 比 ， 其 他 类 型 
的 变换 更 通用 ,也 更 能 拓宽 伪 彩 色 增 强 结果 的 范围 。 
-种 特别 有 吸引 力 的 方法 如 图 6.23 所 示 。 这 一 方法 (FOE RP fol) 
的 基本 概念 是 ， 对 任何 输入 像素 的 灰 度 执行 3 个 独 
立 的 变换 。 然 后 ,将 3 个 变换 结果 分 别 送 入 彩色 电 , PF 
视 监视 器 的 红 、 绿 、 蓝 通道 。 这 种 方法 产生 一 幅 合 
成 图 像 ， 合 成 图 像 的 彩色 内 容 由 变换 函数 的 特性 调 
制 。 注 意 ， 这 些 方法 只 对 一 幅 图 像 的 灰 度 值 进 行 变 
换 ， 而 变换 位 置 。 

前 一 节 讨 论 的 方法 是 刚 描述 的 技术 的 一 种 特殊 情况 。 这 里 ， 灰 度 级 的 分 段 线性 函数 ( 见 图 6.19) 用 
来 产生 颜色 。 另 一 方面 ， 本 节 讨论 的 方法 是 以 平滑 的 非 线 性 函数 为 基础 的 ， 因 此 这 就 在 技术 上 给 出 了 
相当 大 的 灵活 性 。 









图 6.23 ” 伪 彩 色 图 像 处 理 的 功能 框图 。 te. fo Al fe BOT 
HEA RGB 彩色 监视 器 的 红 、 绿 和 蓝 输 入 


例 6.5， 突 出 行李 内 包含 的 爆炸 物 的 伪 彩 色 应 用 。 

图 6.24 (a) 显示 了 由 机 场 X 射线 扫描 系统 得 到 的 行李 的 两 幅 单 色 图 像 。 左 侧 的 图 像 含有 普通 物品 ， 右 
侧 的 图 像 含 有 相同 的 物品 及 一 块 塑 料 仿真 爆炸 物 。 这 个 例子 的 目的 是 说 明 使 用 灰 度 级 到 彩色 的 变换 可 得 到 
不 同 程度 的 增强 。 

图 6.25 显 示 了 所 用 的 变换 函数 。 这 些 正弦 函数 包含 有 在 波峰 附近 相对 恒定 的 区 域 ， 以 及 在 波 谷 附近 迅 
速 变化 的 区 域 。 改 变 每 个 正弦 函数 的 相位 和 频率 可 (以 彩色 ) 强 调 灰 度 级 范围 。 例 如 ， 如 果 所 有 3 个 变换 都 
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有 相同 的 相位 和 频率 ， 则 输出 图 像 将 是 单 色 的 。3 个 变换 函数 间 相 位 上 的 细小 变化 可 产生 对 应 于 正弦 波峰 
的 灰 度 像素 的 微小 变化 ,特别 是 在 正弦 波 有 着 较 宽 的 曲线 (低频 ) 时 。 由 于 正弦 波 间 的 相 移 导致 的 3 个 正弦 
波 的 幅度 明显 不 同 ， 位 于 正弦 波 陡峭 部 分 的 那些 灰 度 级 的 像素 被 赋予 了 更 强 的 彩色 内 容 。 





图 6.24 使 用 图 6.25 ESI RON DRE ( 原 图 像 由 Westinghouse 公司 的 Mike Hurwitz 博士 提供 ) 
























































图 6.25 用 于 得 到 图 6.24 所 示 图 像 的 变换 函数 


图 6.24 (b) 所 示 图 像 是 使 用 图 6.25 (a) 中 的 变换 函数 得 到 的 ， 它 显示 了 与 爆炸 物 、 衣 袋 和 背景 分 别 对 应 
的 灰 度 范围 。 注 意 ， 爆 炸 物 和 背景 有 着 相当 不 同 的 灰 度 级 ， 但 是 由 于 正弦 波 的 周期 性 ， 它们 都 使 用 近似 相 
同 的 颜色 编码 。 示 于 图 6.24(c) 的 图 像 是 用 图 6.25 (b) 所 示 的 变换 函数 得 到 的 。 在 这 种 情况 下 ， 爆炸 物 和 衣 
袋 的 灰 度 范 围 由 相似 的 变换 映射 ， 因此 可 基本 得 到 相同 的 彩色 赋值 。 注意 ， 这 种 映射 允许 观察 者 ， FE 
爆炸 物 。 背 景 映 射 与 图 6.24(b) 所 用 的 函数 相同 ， 产生 几乎 相同 的 彩色 赋值 。 


图 6.23 所 示 的 方法 以 一 幅 单 色 图 像 为 基础 。 
通常 ， 如 图 6.26 所 示 ， 将 多 幅 单 色 图 像 组 合 为 一 fey >| zar FES LN hety) 
幅 彩色 合成 图 像 是 很 重要 的 。 在 多 光谱 图 像 处 理 oe 
中 常 使 用 这 一 方法 (如 例 6.6 所 示 ) ， 这 里 ， 不 ae 
faxy) ERT, [C] e O> hay) 
同 的 传感器 在 不 同 的 谱 段 产生 独立 的 单 色 图 。 ed 
像 。 图 6. 26 ip URRETA 


4) — x(x) 
See Rel hare is ae 
图 像 等 技术 。 图 6.26 几 幅 单 色 图 像 可 用 时 ， 所 用 的 伪 彩 色 编 码 方法 


例 6.6 多 光谱 图 像 的 彩色 编码 。 
图 6.27(a) 到 图 6.27(d) 显示 了 4 i am HH ET LPR, 包括 波 托 马克 河 可 的 一 部 分 。 前 3 幅 图 
像 是 可 见 光 的 红 、 绿 、 蓝 图 像 ， 第 4 幅 图 像 是 近 红外 图 像 ( 见 表 1.1 和 图 1.10) 。 图 6.27(e) 是 把 前 3 WATER 
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合成 为 一 幅 RGB 图 像 后 得 到 的 全 彩色 图 像 。 密 集 区 域 的 全 彩色 图 像 很 难 判读 ， 但 该 图 像 的 一 个 显著 特点 
是 波 托 马克 河 的 各 部 分 颜色 不 同 。 图 6.27 (8 较为 有 趣 ， 这 幅 图 像 是 用 近 红 外 图 像 代替 图 6.27(e) 的 红色 分 
量 形成 的 。 从 表 1.1 可 知 ， 这 一 波段 对 场景 中 的 生物 分 量 有 较 强 的 反应 。 图 6.27 (人 显示 了 生物 (红色 ) 和 场 
景 中 人 为 特征 间 的 明显 区 别 ， 由 混凝土 和 柏油 组 成 的 部 分 在 图 像 中 显示 为 浅 蓝 色 。 












abc 

1 6.27. (a)~(d) 图 1.10 中 的 1 到 4 波段 的 图 像 ( 见 表 1.1); (e) 将 图 (a) (6) ACC) HF 
为 RGB 图 像 的 红 、 绿 、 蓝 分 量 得 到 的 彩色 合成 图 像 ;( 用 相同 的 方法 ,但 在 
红 通 道 使 用 (d) 中 的 近 红外 图 像 得 到 的 图 像 (原始 的 多 光谱 图 像 由 NASA 提供 ) 


刚才 说 明 的 处 理 类 型 ， 在 复杂 图 像 中 对 感 兴趣 物体 进行 可 视 化 处 理 的 功能 很 强大 ， 特 别 是 当 这 些 物体 超出 
了 我 们 的 正常 感知 能 力 时 。 图 6.28 很 好 地 说 明了 这 一 点 。 这 些 图 像 是 通过 把 来 自 “ 伽 利 略 ” 宇 宙 飞 船 的 几 幅 传 
感 器 图 像 组 合 在 一 起 并 以 伪 彩 色 方 式 显 示 的 木 卫 一 的 图 像 ， 其 中 一 些 位 于 人 眼 不 可 见 的 光谱 范围 。 然 而 ， 通 
过 了 解 影响 传感器 响应 的 物理 和 化 学 处 理 , 将 感知 图 像 组 合 为 一 幅 有 意义 的 伪 彩 色 图 中 是 可 能 的 。 组 合 感知 图 
像 数据 的 一 各 方法 在 于 如 何 显示 表面 化 学 成 分 的 差别 ， 或 改变 表面 反射 阳光 的 方式 。 例 如 ， 在 图 6.28 (b) 所 示 
的 伪 彩 色 图 像 中 ， 亮 红色 表示 木 卫 一 上 上 活 火山 最 近 喷 出 的 物质 ， 而 周围 的 黄色 物质 是 陈旧 的 硫 沉积 物 。 这 
幅 图 像 传达 这 些 特征 要 比分 别 分 析 分 量 图 像 更 容易 。 





图 6.28 ”(a) 木 卫 一 的 伪 彩 色 图 像 ，(b) 靠 近 摄 取 的 图 像 ( 原 图 像 由 NASA 提供 ) 


6.4 ”全 彩色 图 像 处 理 基础 


本 节 介 绍 适用 于 全 彩色 图 像 的 处 理 技 术 。 虽 然 这 种 技术 的 研究 远 示 穷尽， 但 本 节 接 下 来 阐述 
的 技术 说 明了 面 对 各 种 图 像 处 理 任务 时 如 何 处 理 彩 色 图 像 。 全 彩色 图 像 处 理 方法 分 为 两 大 类 。 第 E6 
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一 类 是 分 别处 理 每 一 幅 分 量 图 像 ， 然 后 由 分 别处 理 过 的 分 量 图 像 来 形成 一 幅 处 理 过 的 合成 彩色 图 
像 。 第 二 类 是 直接 处 理 彩 色 像 素 。 因 为 全 彩色 图 像 至 少 有 3 个 分 量 ， 所 以 彩色 像素 实际 上 是 向 量 。 
例如 ,在 RGB 系统 中 ,每 个 彩色 点 可 以 用 RGB 坐标 系统 中 从 原点 延伸 到 该 点 的 一 个 向 量 来 解释 ( 见 
图 6.7) 。 

令 c 代 表 RGB 彩色 空间 中 的 一 个 任意 向 量 : 


CR R 
Cg |=| G (6.4-1) 
Cp B 


该 式 指出 ，e 的 分 量 仅 是 一 幅 彩 色 图 像 在 一 点 处 的 RGB 分 量 。 我 们 可 以 这 样 认为 ， 彩 色 分 量 是 坐标 (x, y) 





的 函数 ， 表 示 为 
Ca(X,p) | | R(x, y) 
(x, y) =| ¢g (x,y) |=| G(x, y) (6.4-2) 
cplx, y)] LB(x,y) 











对 于 大 小 为 Mx NM 的 图 像 ， 有 MN 个 这 样 的 向 量 c(x,y), 其 中 x=0, 1,2 , Ml; y=0,1,2,,N-lo 

记 住 ， 式 (6.4-2) 描 述 的 向 量 很 重要 ， 其 分 量 是 关于 x 和 ?的 空间 变量 。 这 常常 是 产生 混 消 的 根源 ， 
但 通过 将 重点 放 在 我 们 感 兴趣 的 空间 处 理 上 ， 可 以 避免 混淆 。 也 就 是 说 ， 我 们 对 以 zx 和 yy 的 公式 来 表 
达 图 像 处 理 技术 感 兴趣 。 根据 像素 现在 是 彩色 像素 的 事实 , 我 们 引入 一 个 因子 , 在 其 最 简单 的 公式 中 ， 
允许 我 们 用 标准 的 灰 度 图 像 处 理 方法 分 别处 理 彩 色 图 像 的 每 个 分 量 。 然 而 ， 单 个 彩色 分 量 处 理 的 结果 
并 不 总 是 等 同 于 彩色 向 量 空间 中 的 直接 处 理 ， 在 这 种 情况 下 ， 我 们 必须 采用 新 的 表达 方法 。 

每 种 彩色 分 量 的 处 理 要 等 同 于 基于 向 量 的 处 理 ， 必 须 满足 两 个 条 件 : 第 一 ， 处 理 必须 对 向 量 和 标 
量 都 可 用 ; 第 二 ， 对 向 量 的 每 个 分 量 的 操作 对 于 其 他 分 量 必 须 是 独立 的 。 作 为 说 明 ， 图 6.29 显示 了 灰 
度 图 像 和 全 彩色 图 像 的 邻 域 空间 处 理 。 假 定 该 处 理 是 邻 域 平 均 。 在 图 6.29(a) 中 , 平均 是 将 邻 域内 的 所 
有 像素 的 灰 度 相 加 ， 然 后 除 以 邻 域内 的 像素 总 数 。 在 图 6.29 (b) 中 ,平均 是 把 邻 域内 的 所 有 向 量 相 加 ， 
并 用 邻 域内 的 向 量 总 数 去 除 每 个 分 量 。 但 平均 向 量 的 每 个 分 量 是 对 应 于 该 分 量 的 图 像 中 的 像素 总 和 |， 
这 与 在 每 个 彩色 分 量 基础 上 做 平均 ， 然 后 再 形成 向 量 所 得 到 的 结果 是 相同 的 。 接 下 来 的 几 节 将 详细 说 
明 这 一 处 理 。 此 外 ， 还 将 给 出 一 种 方法 ， 采 用 这 种 方法 时 ， 两 种 处 理 结果 是 不 同 的 。 








图 6.29 灰 度 图 像 和 RGB 彩色 图 像 的 空间 模板 


6.5 “彩色 变换 
本 节 讨 论 的 技术 总 称 为 彩色 变换 ， 主 要 涉及 在 单一 彩色 模型 内 处 理 彩色 图 像 的 分 量 ， 而 不 是 这 些 


= 分 量 在 不 同 模型 间 的 转换 (如 6.2.3 节 的 RGB 到 HSI 和 HSI 到 RGB 的 转换 ) 。 
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6.5.1 公式 
如 第 3 章 的 灰 度 变换 技术 那样 ， 我 们 用 下 式 表达 的 彩色 变换 作为 模型 ; 
g(x,y) =T[ f(x, y)] (6.5-1) 
式 中 f(x, y) 是 彩色 输入 图 像 ，g(x, 〗) 是 变换 后 或 处 理 过 的 彩色 输出 图 像 ， 了 是 在 (x, y) 的 空间 邻 域 上 对 了 
操作 的 一 个 算 子 。 该 式 与 式 (3.1-1) 的 主要 区 别 在 于 其 描述 不 同 。 这 里 的 像素 值 是 从 彩色 空间 选择 的 、 
用 来 表示 图 像 的 彩色 空间 的 3 元 组 或 4 元 组 ( 即 3 个 值 或 4 个 值 的 组 合 ) ， 如 图 6.29 (b) 所 示 。 
类 似 于 3.2 节 中 用 于 介绍 基本 灰 度 变换 的 方法 ， 本 节 只 关注 形 如 
§ =D iors) i=1,2;,n (6.5-2) 


的 彩色 变换 ， 其 中 ， 为 标记 简单 起 见 ，y 和 s; 是 fx, 和 g(x, 在 任何 点 处 彩色 分 量 的 变量 ,，n 是 彩色 
DER, {Tr Tot, TEX n IRETE ;的 一 组 变换 或 彩色 映射 函数 。 注 意 ，n 个 变换 T 合 并 可 执行 
式 (6.5-1) 中 的 单一 变换 函数 7。 用 于 描述 1 和 g 的 像素 的 所 选 彩色 空间 决定 n 的 值 。 例 如 ， 如 果 选 择 
RGB 彩色 空间 , 则 n=3， 且 ni, 和 7 分 别 表示 输入 图 像 的 红 、 绿 、 蓝 分 量 。 如 果 选 择 CMYK 或 HSI 
彩色 空间 , 则 n=4 或 n=3。 

图 6.30 显 示 了 一 碗 草莓 和 一 杯 咖 啡 的 高 分 辩 率 彩色 图 像 , 它 是 对 大 幅面 (4 英寸 x 5 英寸 ) 彩 色 底 片 
数字 化 后 得 到 的 图 像 。 图 中 的 第 二 行 包含 原始 的 CMYK 扫描 分 量 图 像 。 在 这 些 图 像 的 每 个 CMYK 彩 
色 分 量 中 , 黑 用 0 表示 ， 白 用 1 表示。 这 样 ， 我们 看 到 草 董 由 大 量 的 深 红色 和 黄色 组 成 ， 因 为 对 应 于 
这 两 种 CMYK 分 量 的 图 像 最 亮 。 黑 色 较 少 ， 且 通常 仅 出 现在 咖啡 和 草 莓 碗 的 阴影 中 。 当 CMYK 图 像 
被 转换 为 RGB 时 ， 如 图 中 第 三 行 所 示 ， 可 以 看 到 草莓 包含 大 量 的 红色 和 很 少 的 绿色 与 蓝 色 。 图 6.30 
的 最 后 一 行 显示 了 使 用 式 (6.2-2) 到 式 (6.2-4) 计算 出 的 图 6.30(a) 的 HSI 分 量 图 像 。 如 所 期 望 的 那样 , 强 
度 分 量 是 全 彩色 原始 图 像 的 单 色 再 现 。 另 外 ,草莓 的 颜色 相对 较为 纯净 。 它 们 具有 最 高 的 饱和 度 ， 或 
图 像 中 色调 被 白光 稀释 得 最 少 。 最 后 ， 我 们 注意 到 解释 这 幅 色 度 分 量 图 像 时 的 一 些 困难 。 其 中 包含 这 
样 一 些 事实 : (1) 在 HSI 模型 中 ，0°* 和 360° 相 遇 处 有 一 个 不 连续 点 ; (2) 色 调 对 于 0 饱和 度 ( 即 对 白色 、 
黑色 和 纯 灰 色 ) 未 定义 。 模 型 的 不 连续 点 多 出 现在 草莓 周围 ， 它 们 用 接近 白 (1) 和 黑 (0) 的 灰 度 值 描述 ， 
结果 是 用 不 希望 的 高 对 比 灰 庆 级 来 表示 单一 颜色 一 一 红色 。 

图 6.30 中 的 任何 彩色 空间 分 量 都 可 与 式 (6.5-2) 共同 运用 。 理 论 上 ， 任 何 变换 都 可 在 任何 彩色 模型 
中 执行 。 但 实际 上 ， 某 些 操 作对 特定 的 模型 比较 适用 。 对 于 一 个 给 定 的 变换 ， 表 示 法 之 间 转 换 的 代价 是 
必须 判定 相关 的 彩色 空间 ， 然 后 再 在 该 空间 上 执行 该 转换 。 例 如 ， 假 设 我 们 想 要 使 用 下 式 来 改进 图 6.30 
中 的 全 彩色 图 像 的 强度 : 





g(x,y) =Kf (x,y) (6.5-3) 
式 中 0<k<1。 HIKES HP, PEA FAS OR sem: 
5, =, (6.5-4) 
P si =r All s2= r (UA HSI 强度 分 量 六 被 改变 。 在 RGB 彩色 空间 中 ，3 个 分 量 都 必须 变换 : 
s =kr, i=1,2,3 (6.5-5) 


CMY 空间 要 求 一 组 类 似 的 线性 变换 集 : 
s; =kr,+(1-k), j=1,2;3 (6.5-6) 
虽然 HSI 变换 包含 的 操作 最 少 , 但 把 RGB 图 像 或 CMYK 图 像 转换 至 HSI 空间 所 要 求 的 计算 量 
大 大 抵消 了 简单 变换 的 优点 ， 即 转换 的 计算 量 比 强度 变换 本 身 的 计算 量 大 。 然 而 ， 若 不 考虑 所 选择 
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的 彩色 空间 ， 则 其 输出 是 相同 的 。 图 6.31 (b) 显示 了 采用 式 (6.5-4) 到 式 (6.5-6) 对 图 6.30 所 示 全 彩色 图 
像 用 = 0.7 进行 变换 后 的 结果 。 映 射 函 数 示 于 图 6.31 (c) 到 图 6.31 (e) 中 。 





ARE 
图 6.30 全 彩色 图 像 及 其 各 种 彩色 空间 分 量 ( 原 图 像 由 MedData Interactive 公司 提供 ) 
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1 0 1 0 1 
图 6.31 用 彩色 变换 调整 一 幅 图 像 的 亮度 : (a) 原 图 像 ，(b) 亮度 降低 30% 后 的 结果 ( 即 上 = 0.7) ; 
(c)~(e) 所 需 的 RGB,CMY 和 HSI 变换 函数 ( 原 图 像 由 MedData Interactive 公司 提供 ) 


注意 , 式 (6.5-4) 到 式 (6.5-6) 定义 的 每 个 变换 ， 只 与 彩色 空间 的 一 个 分 量 相关 ， 这 一 点 很 重要 。 例 

如 ， 红 输出 分 量 S, 在 式 (6.5-5) 中 独立 于 绿 (2) 输 入 和 蓝 (3) 输 入 ， 它 只 依赖 于 红 (输入 。 正 如 开始 
讨论 时 所 提 到 的 那样 ， 这 类 变换 是 最 简单 和 最 常用 的 彩色 处 理工 具 ， 并 且 可 以 在 每 个 彩色 分 量 上 执 
sl| 行 。 在 本 节余 下 的 部 分 ， 我 们 研究 几 种 这 样 的 变换 并 讨论 这 样 一 种 情况 ， 在 这 种 情况 下 ， 分 量变 换 
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函数 依赖 于 输入 图 像 的 所 有 彩色 分 量 ， 因 此 不 能 以 单独 的 彩色 分 量 
为 基础 进行 变换 。 


6.5.2 补 色 


在 图 6.32 所 示 的 彩色 环 " 上 , 与 色调 直接 相对 的 另 一 端 被 称 为 补 
色 。 对 补 色 的 兴趣 源 于 这 样 一 个 事实 ， 即 补 色 类 似 于 3.2.1 节 的 灰 度 
负 值 。 正 如 在 灰 度 情况 下 那样 ， 补 色 对 于 增强 艇 在 彩色 图 像 暗 区 的 绿色 
细节 很 有 用 一 一 特别 是 区 域 在 大 小 上 占 优势 时 。 图 6.32 彩色 环 上 的 补 色 


例 6.7 计算 彩色 图 像 的 补 色 。 

图 6.33 (a) 和 图 6.33 (c) 显示 了 来 自 图 6.30 的 全 彩色 图 像 及 其 补 色 图 像 。 用 于 计算 补 色 的 RGB 变换 
如 图 6.33 (b) Bras. 它们 等 同 于 3.2.1 节 中 定义 的 灰 度 负 变 换 。 注 意 ， 计 算 的 补 色 会 使 人 联想 到 普通 照片 的 
彩色 底片 。 原 图 像 的 红色 被 补 色 中 的 青色 替代 。 当 原 图 像 是 黑色 时 ， 补 色 是 白色 ， 以 此 类 推 。 补 色 图 像 中 
每 种 色调 都 用 图 6.32 的 彩色 环 由 原 图 像 预测 ， 且 涉及 补 色 计 算 的 每 个 RGB 分 量变 换 只 是 对 应 的 输入 彩色 
分 量 的 函数 。 

与 图 6.31 的 亮度 变换 不 同 ， 在 这 个 例子 中 使 用 的 RGB 补 色 变 换 函 数 并 没有 HSI 空间 的 直接 等 效 量 。 
我 们 将 其 作为 一 个 练习 留 给 读者 (见习 题 6.18) ， 要 求 说 明 补 色 的 饱和 度 分 量 不 能 单独 从 输入 图 像 的 饱和 度 
分 量 计算 出 来 。 图 6.33(d) 提供 了 一 种 使 用 图 6.33 (b) 给 出 的 色调 、 饱 和 度 和 亮度 变换 的 补 色 的 近似 。 注意， 
输入 图 像 的 饱和 度 分 量 不 可 改变 ; 它 造成 了 图 6.33(c) 和 图 6.33 (d) 之 间 的 视觉 差别 。 
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6.33 ” 补 色 变换 :; (a) 原 图 像 ; (b) 补 色 变换 函数 ; (c) 基于 RGB 映射 
函数 的 图 (a) 的 补 色 ; (d) 使 用 HSI 变换 的 RGB 补 色 的 近似 


6.5.3 HERE 
突出 图 像 中 某 个 特定 彩色 区 域 对 从 其 周围 分 离 出 目标 物体 很 有 用 。 其 基本 思路 不 是 (1) 显示 感 兴 
趣 的 颜色 以 便 从 背景 中 突出 它们 ， 就 是 (2) 像 模板 那样 使 用 由 彩色 定义 的 区 域 ， 以 便 进 一 步 处 理 。 最 


D 该 彩色 环 源 自 艾 萨 克 ' 牛顿 (Isaac Newton) 先生 ， 他 于 17 世纪 连接 了 彩色 谱 的 末端 从 而 形成 了 第 一 个 彩色 环 。 
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直接 的 方法 是 延伸 3.2.4 节 的 灰 度 分 层 技术 。 然而 , 因为 一 个 彩色 像素 是 一 个 n 维 参量 , 得 到 的 彩色 变 


换 函 数 要 比 图 3.1 中 对 应 的 灰 度 变换 函数 复杂 得 多 。 事 实 上 ， 所 要 求 的 变换 比 到 目前 为 止 所 考虑 的 彩 
色 分 量变 换 要 复杂 得 多 。 这 是 因为 所 有 彩色 分 层 方法 都 要 求 每 个 像素 变换 后 的 彩色 分 量 是 所 有 n 个 原 
始 像素 的 彩色 分 量 的 函数 。 

对 彩色 图 像 进行 分 层 的 简单 方法 之 一 是 ， 把 某 些 感 兴趣 区 域 之 外 的 彩色 映射 为 不 突出 的 无 确定 性 
质 的 颜色 。 如 果 感 兴趣 的 颜色 由 宽 为 不 、 中 心 在 原型 ( 即 平均 ) 颜色 点 并 具有 分 量 (cl，w,…，on) 的 立方 
体 ( 或 超 立方 体 ， 此 时 n>3) 所 包围 ， 则 必要 的 一 组 变换 为 


W 
‘te [n-a] EDA (6.5-7) 
Isjen T= 4N >- 
Ry 其 他 


这 些 变换 通过 强迫 所 有 其 他 颜色 为 参考 彩色 空间 的 中 点 (一 个 任意 选取 的 中 性 点 ) ， 来 突出 原型 周围 的 
颜色 。 例 如 ， 对 于 RGB 彩色 空间 ， 合 适 的 中 性 点 是 灰 度 或 彩色 的 中 点 (0.5, 0.5, 0.5). 
如 果 使 用 一 个 圆 球体 来 指定 感 兴趣 的 颜色 ， 则 式 (6.5-7) 变 为 


3 0.5, Dalya > te ae 
Thy 其 他 


SUP Ry ABR (或 超 球形 ,此 时 mz> 3) 的 半径 ,(a az qa) 是 其 中 心 的 分 量 ( 即 原型 颜色 ) 。 式 (6.5-7) 
和 式 (6.5-8) 的 其 他 有 用 变量 包括 实现 多 个 彩色 原型 和 在 感 兴趣 区 域 之 外 减 小 颜色 的 亮度 ， 而 不 是 对 它 
们 赋予 中 性 值 。 


例 6.8 ”彩色 分 层 的 说 明 。 on e 
+ 5 可用 图 631 的 bee 人/ 便 把 可 食用 的 草 芍 部 PR, Wi, neni 


s,= 





-n (6.5-8) 










图 像 区 域 。 实际 值 W=0 
siete por 
身 也 不 被 立方 体 完 全 包围 。 


= we 02549 AE 但 它 本 





ab 
图 6.34 (a) 检测 宽 度 为 - 刺 = 0.2549、 中 心 在 (0.6863, 0.1608, 0.1922) RGB 立方 体内 的 
红色 的 彩色 分 层 变 换 ;，(b) 检测 半径 为 0.1765、 中 心 在 相同 点 的 RGB 球形 中 
的 红色 的 彩色 分 层 变 换 。 处 在 立方 体 和 球形 之 外 的 像素 由 颜色 (0.5, 0.5, 0.5) 代替 
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6.5.4 色调 和 彩色 校正 


彩色 变换 可 在 多 数 台 式 计算 机 上 执行 。 与 数字 摄像 机 、 平 板 扫描 仪 和 喷 墨 打印 机 相连 ， 个 人 计算 
机 就 变 成 了 数字 暗室 ， 从 而 允许 我 们 对 图 像 进行 色调 调整 和 彩色 校正 ; 高 级 彩色 重 现 系统 不 需要 配备 
传统 的 湿式 处 理 ( 暗 室 ) 设 备 即 可 进行 这 些 处 理 。 虽 然 色调 和 彩色 校正 在 其 他 成 像 领域 也 很 有用， 但 当 
前 讨论 重点 关注 的 是 其 最 普通 的 应 用 一 一 照片 增强 和 颜色 再 现 。 

本 节 研 究 的 变换 效果 最 终 要 在 打印 效果 中 评价 。 因 为 这 些 变 换 是 在 监视 器 上 研究 、 改 进 和 评 
价 的 ， 所 以 在 所 用 监视 器 和 最 终 输出 设备 之 间 保 持 色彩 的 高 度 一 致 性 是 必要 的 。 事实 上 ， 监 视 
器 的 颜色 应 准确 地 表示 任何 数字 扫描 的 源 图 像 和 最 后 的 打印 输出 。 最 好 使 用 独立 于 设备 的 彩色 
模型 来 实现 ， 而 彩色 模型 与 监视 器 、 输 出 设备 及 所 用 其 他 设备 的 色 域 有 关 ( 见 6.1 节 ) 。 这 种 方法 
把 每 个 设备 映射 到 模型 及 模型 本 身 的 色彩 分 布 质量 函数 。 许 多 彩色 处 理 系统 (CMS) 选择 的 模型 
是 CIE L*a*b* 模 型 ， 也 称 为 CIELAB (CIE[1978], Robertson[1977]) 。L*a*b* 彩 色 分 量 由 如 下 公式 


给 出 


-06 咱 世 |-1 (6.5-9) 
Yy 


a* = soja) 的 | (6.5-10) 
Xw Yy 

b*= zol EHZ) (6.5-11) 
Yy Zy 


ml fq, q > 0.008 856 
7.787g +16/116, q < 0.008 856 


AH, 


(6.5-12) 


E Xm, Yw 和 .Zw 是 参考 白色 三 激励 值 , 即 CIE 标准 DOS 照度 下 的 一 种 完美 的 漫 反射 白色 (在 图 6.5 所 示 
的 CIE GER, H x= 0.3127 和 y= 0.3290 定义 )。L*a*pb* 彩 色 空间 是 比 色 的 ( 即 ie 
编码 相同 ) 、 感 觉 一 致 的 ( 即 在 各 种 色调 中 颜色 差别 感觉 上 是 一 致 的 ， 见 Mac Adams[1942] 的 经 典 论 
和 独立 于 设备 的 。 虽 然 没 有 可 直接 显示 的 格式 (需要 变换 到 其 他 彩色 空间 ) ， KEFIEK 
谱 ， 并 可 以 准确 地 表示 任何 显示 设备 、 打 印 设备 或 输入 设备 的 颜色 。 类 似 HSI 系统 ，L*a*b* 系 统 是 一 
种 优秀 的 亮度 (由 亮度 L* 表 示 ) 和 彩色 (a* 表 示 红 减 绿 ，b* 表 示 绿 减 蓝 ) 分 离 器 ， 它 在 图 像 操作 (色调 和 
对 比 度 编辑 ) 和 图 像 压 缩 方面 很 有 用 ”。 | 

标定 成 像 系 统 的 主要 意义 是 ， 它 允许 交互 地 和 独立 地 校正 色调 与 色彩 的 不 平衡 ， 即 按 两 个 顺序 操 
作 。 在 解决 诸如 过 饱和 及 欠 饱 和 这 样 的 不 规则 色彩 问题 之 前 ， 先 要 校正 图 像 的 色调 范围 。 一 幅 图 像 的 
色调 范围 (也 称 为 主 调 类 型 ) 是 指 颜 色 强度 的 基本 分 布 。 高 主 调 图 像 的 多 数 信息 集中 在 高 ( 亮 ) 强度 处 ; 
低 主 调 图 像 的 颜色 主要 位 于 低 亮 度 处 ; 中 主 调 图 像 的 颜色 则 位 于 两 者 之 间 。 如 单 色 情况 下 那样 ， 通 常 
期 望 一 幅 彩 色 图 像 的 强度 均匀 分 布 在 高 亮 和 阴影 之 间 。 下 面 的 几 个 例子 说 明了 用 于 校正 色调 和 色彩 不 
平衡 的 各 种 彩色 变换 。 


D 研究 表明 ，L*a*b* 中 照度 (亮度 ) 信 息 与 彩色 信息 分 离 的 程度 要 大 于 其 他 彩色 模型 中 [如 CIELUV, YIQ, YUV, YCC 和 
XYZ (Kasson and Plouffe[1992]) ] 的 相应 程度 。 
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例 6.9 色调 变换 。 

改善 图 像 色 调 的 变换 通常 需要 交互 选择 。 fe Eu ME QE LL, 以 便 在 合适 的 灰 度 
范围 提供 最 多 的 细节 。 彩 色 本 身 并 不 改变 。 在 RGB 和 CMY(K) 空 间 中 ， 这 意味 着 使 用 相同 的 变换 函数 映 
射 所 有 3 (或 4) 个 彩色 分 量 ; 在 HSI 彩色 空间 中 , 则 改进 了 亮度 分 量 。 

图 6.35 显 示 了 用 于 校正 3 种 常见 色调 不 平衡 的 几 个 典型 变换 一 一 即 平淡 的 、 较 亮 的 和 较 暗 的 图 像 。 图 中 第 
一 行 的 S 形 曲线 对 提升 对 比 度 较为 理想 [ 见 图 3.2(a) ] 。 其 中 的 点 被 国定， 因此 高 亮 区 域 和 阴影 区 域 可 分 别 变 
暗 和 加 亮 (该 曲线 反 过 来 可 用 于 校正 过 大 的 对 比 度 ) 。 图 中 第 三 行 和 第 三 行 中 的 变换 校正 较 亮 图 像 和 较 暗 图 像 
并 使 人 联想 到 图 3.6 中 的 宕 律 变 换 。 虽 然 彩色 分 量 是 离散 的 ， 如 现在 的 实际 变换 函数 ， 但 这 些 变换 函数 本 身 
以 连续 量 显示 和 操作 一 一 通常 由 分 段 线性 或 高 阶 (对 平滑 映射 ) 多 项 式 构造 。 注 意 ， 在 图 635 中 ， 图 像 的 主 
调 可 直接 观察 ; 它们 还 可 以 用 图 像 彩色 分 量 的 直方 图 来 确定 。 




















校正 后 的 图 像 

















较 暗 图 像 校正 后 的 图 像 0 


图 6.35 ”对 平淡 的 、 较 亮 的 (高 主 调 ) 、 较 暗 的 ( 低 主 调 ) 彩 色 图 像 的 色调 校 
正 。 等 量 地 调整 红 、 绿 、 蓝 分 量 并 不 总 能 显著 地 改变 图 像 色调 


例 6.10 “彩色 平衡 。 be 

eg ak ls AERA. MAVEYAPIUANEN 
i 可 以 进行 准确 的 视觉 评估 .如 图 6.36 所 示 的 那样 ， ee i 
WH, PI ARIA AAEM, SEAN, 各 亮 红色 的 物体 ， 在 渤 和 视觉 形 色 评 信 时 并 没有 
什么 价值 

wee ee ee eee EREEREER ANAN 
到 图 像 的 全 部 彩色 平衡 . 也 就 是 说 , 对 一 种 颜色 的 感知 会 受到 周围 颜色 的 影响 。 不 过 ,图 632 的 彩色 环 可 用 
于 预测 一 个 彩色 分 量 如 何 影响 其 他 彩色 分 量 。 例 如 ， 革 于 该 彩色 环 ， 任 何 闫 色 的 比例 都 可 通过 减 小 图 像 中 
相对 色 (或 补 色 ) 数 量 来 增 大 。 类 似 地 ， 提 高 两 种 直接 邻接 颜色 的 比例 ， 或 碱 小 与 该 补 色 邻接 的 丙种 颜色 的 


+ 
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百分比 ， 也 可 增 大 颜色 的 对 比 。 例 如 ;假定 一 幅 RGB 图 像 中 有 过 多 的 深 红色 ， 则 可 通过 (1) 移 去 红色 和 路 
色 或 (2) 增 加 绿色 的 方法 减少 它 。 

图 636 A TF AER CMYK RH 注意 ， 描述 的 变换 是 校正 这 些 图 像 所 要 求 的 
函数 。 这 些 函 数 的 反 函 数 用 来 产生 相关 的 彩色 不 平衡 。 这 些 图 像 类 似 于 暗室 环境 下 的 彩色 印 相 ， 是 识别 彩 
色 打印 问题 的 有 用 参考 工具。 例如 ， 过 多 的 深 红色 (左下 图 像 ) 或 太 少 的 青色 (第 二 行 最 右 侧 的 图 像 ) 会 导致 
太 多 的 红色 。 








原 图 像 /校正 后 的 图 像 











1 1 


/| 深 红色 较 重 | | Ir 


RA ERS 


7 tena 











0 1 0 1 
图 6.36 对 CMYK 图 像 的 彩色 平衡 校正 





6.5.5 直方 图 处 理 


与 前 一 章 中 介绍 的 交互 式 增强 方法 不 同 ，3.3 节 的 灰 度 直方 图 处 理 变换 可 自动 地 应 用 于 彩色 图 像 。 
回忆 可 知 ， 直 方 图 均衡 会 自动 地 确定 一 种 变换 ， 该 变换 试图 产生 具有 均匀 灰 度 值 的 直方 图 的 图 像 。 在 
单 色 图 像 情况 下 ， 业 已 证 明 ( 见 图 3.20) 在 处 理 低 、 高 和 中 主 调 图 像 时 是 合理 而 且 成 功 的 。 然 而 ， 由 
于 彩色 图 像 是 由 多 个 分 量 组 成 的 ， 所 以 必须 考虑 适应 多 个 分 量 和 /或 直方 图 的 灰 度 级 技术 。 如 预料 的 
那样 ， 单 独 对 彩色 图 像 的 分 量 进行 直方 图 均衡 通常 是 不 明智 的 ， 这 将 产生 不 正确 的 彩色 。 一 种 更 合 aoo 
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乎 逻辑 的 方法 是 , 均匀 地 展开 这 种 彩色 灰 度 ， 而 保持 彩色 本 身 ( 即 色调 ) 不 变 。 下 面 的 例子 表明 HSI 彩 
色 空 间 是 适合 这 类 方法 的 理想 空间 。 


例 6.11 HSI 彩色 空间 中 的 直方 图 均衡 。 

图 6.37(a) 显示 了 含有 调味 瓶 和 摇 杯 的 调味 人 台 的 一 幅 彩 色 图 像 , 其 亮度 分 量 ( 归 一 化 后 ) 的 值 域 为 
[0，1]。 正 如 所 看 到 的 处 理 前 的 [ 见 图 6.37(b) ] 亮度 分 量 直方 图 那样 ， 图 像 包 含有 大 量 的 暗 彩 色 ， 使 得 中 
间 灰 度 减少 到 0.36。 不 改变 色调 和 饱和 度 , 亮度 分 量 直 方 图 均衡 的 结果 图 像 示 于 图 6.37(c) 中 。 注意 ,整个 
图 像 都 被 有 效 地 加 亮 , 并 且 一 些 调味 瓶 和 放 调 味 瓶 的 木 桌 的 纹理 现在 都 清晰 可 见 。 图 6.37(b) 显示 了 新 图 像 
的 亮度 直方 图 ， 以 及 用 于 均衡 亮度 分 量 的 变换 [ 见 式 (3.3-8) ] 。 

虽然 亮度 均衡 处 理 并 不 改变 图 像 的 色调 和 饱和 度 的 值 , 但 它 的 确 影 响 了 图 像 的 整体 颜色 感 观 。 特别 要 
注意 在 不 振动 时 , 瓶 中 的 油 和 醋 。 图 6.37(d) 显示 了 采用 增加 图 像 饱和 度 分 量 部 分 校正 该 问题 的 结果 。 然后 
使 用 图 6.37(b) 中 的 变换 进行 了 直方 图 均衡 。 在 处 理 HSI 空间 中 的 强度 分 量 时 ， 这 种 类 型 的 调整 很 常见 ， 
因为 灰 度 改变 通常 会 影响 图 像 中 颜色 的 相对 表 观 。 














图 6.37 HSI 彩 色 空 间 中 的 直方 图 均衡 (接着 是 饱和 度 调整 ) 


6.6 平滑 和 锐 化 


在 不 涉及 相 邻 像素 的 情况 下 (如 前 节 那 样 )， 对 彩色 图 像 的 每 个 像素 变换 后 的 下 一 步 是 ， 以 周 
围 像 素 特性 为 基础 改进 该 像素 的 值 。 本 节 通 过 彩色 图 像 的 平滑 和 锐 化 处 理 ， 说 明 这 类 邻 域 处 理 的 
基础 。 

6.6.1 彩色 图 像 平滑 


参考 图 6.29(a) 和 3.4 WR 3.5 节 的 讨论 ， 灰 度 级 图 像 平 滑 可 视 为 一 种 空间 滤波 操作 ， 在 这 种 
操作 中 ， 滤 波 模板 的 系数 具有 相同 的 值 。 当 模板 滑 过 将 被 平滑 的 图 像 时 ， 每 个 像素 被 由 该 模板 定 
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义 的 邻 域 中 的 像素 的 平均 值 代替 。 如 在 图 6.29 (b) 中 看 到 的 那样 ,这 一 概念 很 容易 推广 到 全 彩色 图 像 处 
理 。 主 要 差别 是 ,我们 必须 处 理由 式 (6.4-2) 给 出 的 分 量 向 量 来 替代 灰 度 标量 值 。 

在 一 幅 RGB KERAF, S So RRP LEF, y) 的 邻 域 定义 的 一 组 坐标 。 在 该 邻 域 中 RGB 分 
量 的 向 量 平 均值 为 








二 D. eGA) (6.6-1) 
K (st)es, 
它 满足 式 (6.4-2) 和 向 量 相 加 的 性 质 ， 因 此 有 
[1 
一 R(s,t) 
K (s,tH)eS,, 
c(x,y)= oe G(s,t) (6.6-2) 
K (s,HeS,, 
X > B(s,t) 
|K (s,teS,, 中 
我 们 将 该 向 量 的 分 量 视 为 几 幅 标量 图 像 ， 这 些 标量 图 像 可 通过 传统 的 meer | 


灰 度 级 邻 域 处 理 ， 单 独 地 平滑 原 RGB 图 像 的 每 个 平面 来 得 到 。 这 样 ， | 请 查阅 本 书 的 网 站 。 
我 们 就 可 得 出 结论 : 邻 域 平均 平滑 可 以 在 每 个 彩色 平面 的 基础 上 执行 。 a SIENEN 
其 结果 与 使 用 RGB 彩色 向 量 执行 平均 是 相同 的 。 


例 6.12 ”用 邻 域 平均 法 平滑 彩色 图 像 。 

考虑 图 6.38 (a) 中 的 彩色 图 像 , 该 图 像 的 红 、 绿 、 蓝 分 量 图 像 显 示 在 图 6.38 (b) 到 图 6.38(d) 中 。 图 6.39 (a) 
到 图 6.39(c) 显示 了 该 图 像 的 HSI 分 量 。 基 于 前 一 段 的 讨论 ， 我 们 用 大 小 为 5x5 的 空间 平均 模板 独立 地 平 
滑 图 6.38 中 的 RGB 图 像 的 每 个 分 量 图 像 。 然 后, 混合 这 些 独立 平滑 后 的 图 像 以 形成 平滑 后 的 全 彩色 结果 ， 
结果 示 于 图 6.40(a) 中 。 注 意 ， 正 如 在 3.5 节 中 给 出 的 几 个 例子 那样 ， 这 幅 图 像 显 示 了 我 们 所 希望 的 执行 空 
间 平 滑 操 作 的 结果 。 

在 6.2 节 中 , 我 们 曾 说明 HSI 彩色 模型 的 一 个 重要 优点 是 ， 解 除了 强度 和 彩色 信息 的 联系 ， 这 就 使 得 
它 适 合 于 许多 灰 度 处 理 技术 ， 并 且 可 能 仅 对 图 6.39 中 HSI 描述 的 亮度 分 量 平滑 更 有 效 。 为 了 说 明 这 一 方 
法 的 优点 和 /或 重要 性 , 下 面 我 们 仅 平滑 亮度 分 量 (保持 色调 和 饱和 度 分 量 不 变 ), 并 为 便于 显示 把 处 理 结果 
转换 为 RGB 图 像 ,平滑 后 的 彩色 图 像 示 于 图 6.40(b) 中 。 注 意 , 该 图 像 类 似 于 图 6.40 (a) ,但 正如 从 图 6.40 (c) 
所 示 的 差 值 图 像 中 看 到 的 那样 ,两 幅 平 滑 过 的 图 像 是 不 同 的 。 这 是 因为 在 图 6.40(a) 中 , 每 个 像素 的 颜色 是 
邻 域 中 的 像素 的 平均 颜色 。 另 一 方面 , 通过 仅 平滑 图 6.40 (b) 中 的 亮度 分 量 图 像 , 每 个 像素 的 色调 和 饱和 度 
不 受 影响 ， 因 此 像素 的 颜色 无 变化 。 由 这 一 观察 可 知 ， 两 种 平滑 方法 间 的 差别 会 随 着 滤波 器 尺寸 的 增加 而 
变 得 更 为 显著 。 





abed 





图 6.38 





(a) RGB 图 像 ;(b) 红 分 量 图 像 ; (0) 绿 分 
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Cy 


图 6.39 图 6.38(a) 中 的 RGB 彩色 图 像 的 HSI 分量 : (a) 色 调 ; (b) 饱和 度 ; (c) 亮 度 


abe 
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图 6.40 用 5x5 的 平均 模板 平滑 图 像 : (a) 处 理 每 一 个 RGB 分 量 图 像 的 结果 ; (b) 处 
理 HSI 图 像 的 亮度 分 量 并 转换 为 RGB 图 像 后 的 结果 ; (ec) 两 种 结果 的 差别 


6.6.2 ”彩色 图 像 锐 化 


本 节 介 绍 采 用 拉 普 拉 斯 变换 方法 ( 见 3.6.2 节 ) 的 图 像 ( 尖 ) 锐 化 处 理 。 从 向 量 分 析 可 知 ， 一 个 向 量 的 
拉 普 拉 斯 变换 定义 为 一 个 向 量 ， 其 分 量 等 于 输入 向 量 的 各 个 标量 分 量 的 拉 普 拉 斯 变换 。 在 RGB 彩色 
系统 中 ， 式 (6.4-2) 中 向 量 c 的 拉 普 拉 斯 变换 为 

V? R(x, Y) 
V’ [e(x, y)] =| V° G(x, y) (6.6-3) 
V? B(x, y) 
如 前 节 所 述 ， 它 告诉 我 们 可 通过 分 别 计算 每 幅 分 量 图 像 的 拉 普 拉 斯 变换 来 计算 全 彩色 图 像 的 拉 普 拉 
斯 变换 。 

例 6.13 使 用 拉 普 拉 斯 变换 的 锐 化 。 

图 6.41 (a) 是 使 用 式 (3.6-7) 和 图 3.37 (c) 中 的 模板 计算 6.38 中 的 RGB 分 量 图 像 的 拉 普 拉 斯 变换 得 到 
的 。 这 些 结果 合并 在 一 起 就 产生 了 锐 化 后 的 全 彩色 图 像 。 图 16.41 (b) 显示 了 基于 图 6.39 中 HSI 分 量 的 类 似 
的 锐 化 图 像 。 这 一 结果 是 通过 合并 亮度 分 量 的 拉 普 拉 斯 变换 和 未 变化 的 色调 与 饱和 度 分 量 生成 的 。RGB 
和 HSI 锐 化 图 像 间 的 差别 示 于 图 6.41 (c) 。 两 幅 图 像 之 间 存在 这 种 差别 的 原因 见 例 6.12。 





WW Ww. Ibi ¢ 
图 6.41 使 用 拉 普 拉 斯 变换 锐 化 图 像 ; (a) 处 理 每 个 RGB 通道 的 结果 ; (b) 处 
H HSI 亮度 分 量 并 转换 为 RGB 图像 后 的 结果 ; (c) 两 种 结果 的 差别 
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6.7 基于 彩色 的 图 像 分 割 


分 割 是 把 一 幅 图 像 分 成 多 个 区 域 的 处 理 。 虽 然 分 割 是 第 10 章 讨 论 的 主题 , 但 出 于 连续 性 的 原因 ， 
这 里 简单 地 介绍 一 下 彩色 分 割 。 在 下 面 的 讨论 中 ， 读 者 不 会 有 理解 方面 的 困难 。 


6.7.1 HSI 彩色 空间 的 分 割 


如 果 我 们 希望 以 彩色 为 基础 来 分 割 一 幅 图 像 ， 并 想 在 各 个 平面 上 执行 这 一 处 理 ， 那 么 我 们 会 很 自 
然 地 首先 想到 HSI 空 间 ， 因 为 在 色调 图 像 中 描绘 彩色 很 方便 。 通 常 ， 为 了 在 色调 图 像 中 分 离 出 感 兴 趣 
的 孤立 区 域 ， 我们 会 把 饱和 度 用 做 一 幅 模 板 图 像 。 在 彩色 图 像 分 割 中 不 常 使 用 亮度 图 像 ， 因 为 它 不 携 
带 彩 色 信 息 。 下 面 是 如 何在 HSI 彩色 空间 中 执行 分 割 的 典型 例子 。 


例 6.14 HSI 空间 中 的 分 割 。 

假定 我 们 的 兴趣 是 分 割 图 6.42 (a) 中 左下 角 图 像 中 的 微 红色 区 , 虽然 它 是 用 伪 彩 色 方 法 产生 的 , 但 
可 以 像 全 彩色 图 像 那样 处 理 (分割 ) 而 不 失 一 般 性 。 图 6.42 (b) 到 图 6.42 (d) 是 它 的 HSI 分 量 图 像 。 注 意 ， 
比较 图 6.42 (a) 和 图 6.42 O 发 现 ， 我 们 感 兴趣 的 区 域 具 有 相对 高 的 色调 值 ， 这 表明 这 些 颜 色 位 于 红色 的 
蓝 - 深 红 侧 ( 见 图 6.13) Fl 6.42 (e) 显示 了 一 个 用 国 值 处 理 饱和 度 图 像 产 生 的 二 值 模板 ， 该 闪 值 等 于 图 像 的 
最 大 饱和 度 的 10%。 大 于 该 国 值 的 任何 像素 值 都 被 置 为 (AE), ， 所 有 其 他 值 被 置 为 0( 器 色 ) 。 

图 6.42(D 是 色调 图 像 与 该 模板 的 乘积 ,图 6.42 (g) 是 乘积 图 像 的 直方 图 (注意 ， 灰 度 级 在 范围 [0, 1] 内 ) 。 
在 直方 图 中 可 以 看 到 , 高 值 ( 感 兴趣 的 值 ) 被 分 组 到 灰 度 的 最 高 端 , 接近 1.0。 用 闵 值 0.9 对 乘积 图 像 进行 净 
值 处 理 后 得 到 的 二 值 图 像 示 于 图 6.42 h) 。 在 该 图 像 中 , 白色 点 的 空间 位 管 视 为 原 图 像 的 中 点 , 它 具 有 感 兴 
趣 的 微 红色 调 。 这 与 完美 的 分 割 相 差 其 远 ， 因 为 在 原 图 像 中 还 应 该 有 一 些 具有 微 红色 调 的 点 , 但 它们 未 被 
该 分 割 方法 识别 出 来 。 然而 , 实验 表明 ,在 识别 原 图 像 的 微 红 色 分 量 时 , 图 6.42 h) 所 示 的 白色 区 域 是 这 种 
方法 所 能 做 到 的 最 好 结果 。 下 一 节 讨论 的 分 割 方法 可 产生 相当 好 的 结果 。 








$ 


分 割 : (a) 原 图 像 ，(b) 色 调 图 像 ;〈c) 饱 和 度 图 像 ; 〈d) 亮度 图 像 ; (e) 二 值 饱和 
度 模板 ( 黑 =0); (E b) 和 图 (e) 相 乘 后 的 结果 ; (g) 图 (的 直方 图 ;(h) 图 (a) 中 红色 分 量 的 分 割 


6.7.2 RGB 向 量 空间 中 的 分 割 
正如 本 节 多 次 提 到 的 那样 ， 虽 然 在 HSI 空间 的 工作 更 直观 ， 但 分 割 却 是 用 RGB 彩色 向 量 


465 


能 得 到 更 好 结果 的 领域 。 这 种 方法 很 直接 。 假 如 我 们 的 目的 是 在 一 幅 RGB 图 像 中 分 割 式 个 指 | 
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定 颜色 区 域 的 物体 ,给 定 一 个 感 兴趣 的 有 代表 性 彩色 的 彩色 样 点 集 ,可 得 到 我 们 希望 分 割 的 颜色 的 “ 平 
均 ” 佑 计 。 令 这 个 平均 彩色 用 RGB 向 量 a 来 表示 。 分 割 的 目的 是 将 给 定 图 像 中 的 每 个 RGB 像素 分 类 ， 
即 在 指定 的 区 域内 是 否 有 一 种 颜色 。 要 执行 这 一 比较 ， 必 须 有 一 个 相似 性 度量 。 最 简单 的 度量 之 一 是 
欧 氏 距离 。 令 z 表示 RGB 空间 中 的 任意 一 点 。 如 果 它 们 之 间 的 距离 小 于 特定 的 阔 值 Do, WEK z 与 a 是 
相似 的 。z 和 a 间 的 欧 氏 距离 由 下 式 给 出 : 


1 1 
D(z, a) =||z—all|=[(z-a)" (z-a)? =| (zp — ag)? + (ze — ag)? + (Zp =a} | (6.7-1) 


其 中 下 标 R, G, B 表示 向 量 a 和 z 的 RGB 分量 ,满足 D(z, a) < Do 的 点 的 轨迹 是 半径 为 Do 的 实心 球体 ， 
如 图 6.43 (a) 所 示 。 包含 在 球体 内 部 和 表面 上 的 点 满足 指定 的 颜色 准则 ; 球体 之 外 的 点 则 不 满足 指定 的 
颜色 准则 。 在 图 像 中 对 这 两 组 点 编码 ， 比 如 说 黑 或 白 ， 就 产生 了 一 幅 二 值 分 割 图像 。 

式 (6.7-1) 的 一 种 有 用 推广 是 形 如 下 式 的 距离 度量 : 


D(z, a) =|(z—-a)'C1(z- ak (6.7-2) 


其 中 C 表示 我 们 希望 分 割 的 有 代表 性 颜色 的 样本 的 协 方差 矩阵 `。 满足 D(z, a) < Dy 的 点 的 轨迹 描述 了 
一 个 实心 的 三 维 椭 球体 [ 见 图 6.43 (b) ,该 椭 球 体 的 最 大 特点 是 主轴 面向 最 大 数据 扩展 方向 。 当 C= 了 
时 ， 则 为 3x3 的 单位 矩阵 ， 式 (6.7-2) 简化 为 式 (6.7-1) 。 这 时 的 分 割 与 前 一 段 中 描述 的 分 割 相 同 。 
因为 距离 是 正 的 和 单调 的 ， 所 以 可 用 距离 的 平方 运算 来 代 蔡 ， 从 而 避免 开 方 运算 。 然 而 ， 即 使 不 
计算 平方 根 ， 对 于 实际 大 小 的 图 像 来 说 ， 实 现 式 (6.7-1) 或 式 (6.7-2) 的 计算 代价 也 很 高 。 一 种 折 中 方案 
是 使 用 一 个 边界 盒 ， 如 图 6.43 (c) 所 示 。 在 该 方法 中 , 盒 的 中 心 在 & 处 ， 沿 每 个 颜色 轴 选 择 的 维 数 与 沿 
每 个 轴 的 样本 的 标准 差 成 比例 。 标 准 差 的 计算 只 使 用 一 次 样本 颜色 数据 。 


B B abe 





图 643 为 RGB 向 量 分 割 圈定 数据 区 域 的 3 种 方法 
给 定 一 个 任意 的 彩色 点 , 如 同 采用 距离 公式 那样 , 通过 确定 它 是 否 在 盒子 表面 或 内 部 来 进行 分 割 。 
然而 ， 判 定 一 个 彩色 点 是 在 盒子 内 部 还 是 在 盒子 外 部 ， 在 计算 上 要 比 求 球 体 或 椭 球 的 界限 简单 得 多 。 
注意 ， 前 面 的 讨论 是 6.5.3 节 中 介绍 的 与 彩色 分 层 有 关 方 法 的 推广 。 
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对 整个 彩色 图 像 中 的 每 一 点 的 编码 结果 如 下 : 如 果 该 点 位 于 盒子 的 表面 或 内 部 ， 则 编码 为 白色 ; 否则 编码 
为 黑色 。 编 码 后 的 结果 示 于 图 6.44(b) 。 注 意 分 割 后 的 区 域 是 如 何 由 矩形 封闭 的 彩色 样本 推广 的 。 事 实 上 ， 
比较 图 6.44 (b) 和 图 6.42 (h) ， 可 看 到 在 RGB 向 量 空 间 分 割 会 产生 准确 得 多 的 结果 。 在 一 定 意义 上 , 在 原 彩 
色 图 像 中 它们 更 接近 于 我 们 定义 的 “ 微 红 色 ”。 





图 6.44 RGB 空间 中 的 分 割 : (a) 用 一 个 封闭 的 矩形 表示 的 感 兴趣 的 彩 
色 原 像 ;(b) RGB 向 量 空间 中 的 分 割 结果 。 请 与 图 6.42 (h) 比较 


6.7.3 ”彩色 边缘 检测 


如 第 10 章 讨论 的 那样 ， 边 缘 检测 对 图 像 分 割 来 说 是 一 个 重要 的 工具 。 在 本 节 中 ,我 们 的 兴趣 在 
于 以 单一 图 像 为 基础 计算 边缘 和 直接 在 彩色 向 量 空间 中 计算 边缘 的 问题 。 基 于 边缘 的 分 割 的 详细 内 容 
将 在 10.2 节 中 给 出 

梯度 算 子 边 缘 检 测 已 在 3.64 节 有 关 图 像 锐 化 的 内 容 中 介绍 过 。 遗 憾 的 是 ，3.6.4 节 中 讨论 的 梯度 
对 向 量 没有 定义 。 这 样 ， 我 们 会 立刻 想到 ， 计 算 单 幅 图 像 的 梯度 ， 然 后 用 得 到 的 结果 形成 一 幅 彩 色 图 
像 ， 将 会 导致 错误 的 结果 。 一 个 简单 的 例子 可 帮助 我 们 说 明 其 原因 。 

考虑 图 6.45 (d) 和 图 6.45 (h) 中 的 两 幅 MxM 彩 色 图 像 (M 为 奇数 )， 它们 分 别 由 图 6.45 (a) 到 
图 6.45 (c) 和 图 6.45(e) 到 图 645(g) 中 的 3 个 分 量 图 像 组 成 。 例如， 如 果 计 算 每 个 分 量 图 像 的 梯度 [ 见 
式 (3.6-11) |, 并 将 结果 相 加 形成 两 幅 相应 的 RGB 梯度 图 像 , 则 点 [CM+ 1)/2, (M+ 1)/2] 处 的 梯度 值 在 两 
种 情况 下 都 将 相同 。 直 观 地 看 ， 我 们 希望 图 6.45(d) 中 图 像 那 一 点 的 梯度 更 强 ， 因 为 R，G, B 图 像 的 边 
缘 在 该 图 像 中 的 方向 相同 ， 而 相对 于 图 6.45 h) 的 图 像 ， 只 有 两 个 边缘 具有 相同 的 方向 。 从 这 个 简单 的 
例子 可 以 看 出 ， 处 理 3 和 i 果 。 如 果 问 题 只 是 检测 边 
缘 ， 则 单独 分 量 方法 通常 可 产生 能 接受 的 结果 。 然 而 ， 如 果 准 确 度 是 重点 ， 则 很 明显 我 们 需要 一 个 适 
用 于 向 量 的 梯度 的 新 定义 。 下 面 讨论 Di Zenzo[1986] 为 此 提出 的 一 种 方法 。 


= € 


468 
图 645 (a)~(c)R, G, B 分量 图 像 ，(d) 产 生 的 RGB 彩色 图 像 ; (e)~(g)R,G,B 分 量 图 像 ，(h) 产 生 的 RGB 彩色 图 像 
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现 有 的 问题 是 定义 式 (6.4-2) 中 向 量 c 在 任意 点 (x, 处 的 梯度 (幅度 和 方向 ) 。 如 刚 提 及 的 那样 ， 
3.6.4 节 中 我 们 研究 过 的 梯度 适用 于 标量 函数 f(x,y) , 但 不 能 用 于 向 量 函 数 。 下 面 是 许多 方法 中 的 一 
种 ,在 这 种 方法 中 , 我 们 可 以 针对 向 量 函 数 扩展 梯度 的 概念 。 回 忆 可 知 ， 对 于 标量 函数 tx, y), 梯度 是 
坐标 (x, y) 处 指向 /的 最 大 变化 率 方向 的 向 量 。 

S r, g 和 5b 是 沿 RGB 彩色 空间 ( 见 图 6.7) 的 R,G,8B 轴 的 单位 向 量 ,并 定义 向 量 


eh (6.7-3) 
Be an? Oe 
All 
gee Be ge Bs , (6.7-4) 
oy Qo oY 


S Beer Sy 和 gy 表示 这 些 向 量 的 点 积 ， 如 下 所 示 : 




















2 2 
ge ari’ ,|ac| , |aB (6.7-5) 
Ox Ox Ox 
2 2 
is + êB (6.7-6) 
y 


























Zy =u v= u'y ss 2G O85, 2B AR (6.7-7) 
Ox Oy Ox Oy Ox Oy 
WHE, R, GAIB 以 及 由 此 而 来 的 g 项 是 x 和 y 的 函数 。 使 用 这 种 表示 法 ， 可 以 证 明 (Di Zenzo[1986]) , 


c(x,») 的 最 大 变化 率 方 向 可 以 由 角度 


2 
O(x, y) = al wis | (6.7-8) 





给 出 ， 且 在 角度 Gy) 方 向 上 点 (xc 习 处 的 变化 率 的 值 由 下 式 给 出 : 


1 

F, (x, y)= l [Ea + By) + (Ex — yy) COS 20(x, y)+ 2g, sin 20(x, yy (6.7-9) 
FA tan(a) = tan(a+ n), WRO EN (6.7-8) 的 一 个 解 , 则 6 土工 也 是 该 式 的 一 个 解 。 此 外 , 由 于 Fg= Fom 
所 以 五 仅 需 对 9 值 在 半 开 区 间 [0, n) 内 计算 。 式 (6.7-8) 提供 两 个 相隔 90° 的 值 这 一 事实 ， 意 味 着 该 式 在 每 
个 点 Gx, 处 涉及 两 个 正 交 方向 。 沿 着 这 些 方向 之 一 , 下 最 大 ,， 沿 其 他 方向 羽 最 小 。 这 些 结果 的 推导 相当 
元 长 ,并且 在 这 里 详细 讨论 它 对 我 们 当前 讨论 的 基本 目标 益处 不 大 。 其 细节 可 参考 Di Zenzo[1986]。 实 
现 式 (6.7-5) 到 式 (6.7-7) 所 要 求 的 偏 导数 ， 可 用 3.6.4 节 讨 论 的 Sobel fei 
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abed 
图 6.46 (a)RGB AYA; (b) Æ RGB 彩色 空间 中 计算 的 梯度 ; (c) 在 每 
幅 图 像 基 础 上 计算 梯度 ， 然 后 相 加 ; (d) 图 (b) 和 图 (c) 的 差 


ata 


图 6.47 pe E (a) 红 分 量 ;，(b) 绿 分 量 ; 
;) 蓝 分 量 。 这 3 幅 图 像 相 加 并 标定 后 产生 了 图 6.46(c) 中 的 图 像 


6.8 彩色 图 像 中 的 噪声 





5.2 节 中 讨论 的 噪声 模型 可 用 于 彩色 图 像 。 通 常 ， 彩 色 图 像 的 噪声 内 容 在 每 个 彩色 通道 中 具有 相 
同 的 特性 ， 但 噪声 对 不 同 彩 色 通 道 所 造成 的 影响 不 同 。 一 种 可 能 是 个 别 通道 的 电子 学 故障 。 然 而 ， 不 
同 的 噪声 水 平 像 是 由 每 个 彩色 通道 的 相对 照射 强度 的 差异 造成 的 。 例 如 , 在 CCD 摄像 机 中 ， 红 色 滤 
镜 的 使 用 将 减 小 用 于 红色 传感器 的 照射 强度 。CCD 传感器 在 低 照明 水 平 下 就 是 噪声 源 ， 因 此 ， 这 种 情 
况 下 得 到 的 RGB 图 像 的 红色 分 量 图 像 与 其 他 两 幅 分 量 图 像 相 比 往往 是 噪声 源 


例 6.17 将 RGB 带 噪 图 像 转换 为 HSI 的 效果 说 明 。 

在 这 个 例子 中 ， 我 们 将 简单 地 看 一 下 彩色 图 像 中 的 噪声 ， 以 及 在 从 一 个 彩色 模型 转换 为 另 一 个 模 
型 时 ， 噪 声 是 如 何 转移 的 。 图 6.48 (a) 到 图 6.48 (c) 显示 了 被 高 斯 噪声 污染 的 一 幅 RGB 图 像 的 3 个 彩 
ae 图 6.48 (中 是 合成 的 RGB 图 像 。 注 意 ， 与 在 单 色 图 像 中 相 比 ， 细 粒 噪声 在 彩色 图 像 中 不 太 引 
人 注意 。 图 6.49 (a) 到 图 6.49(c) 显示 了 把 图 6.48 (d) 中 的 RGB 图 像 转换 为 HSI 的 结果 。 将 这 些 结果 与 原 
图 像 ( 见 图 6.39) 的 HSI 分 量 进行 比较 ， 会 发 现 品 志 TOSE 饱和 度 分 量 明 显 降低 了 。 这 分 别 是 由 
式 (6.2-2) 和 式 (6.2-3) 求 余弦 与 取 最 小 值 操作 的 非 线性 造成 的 。 另 一 方面 ， 图 6.49(c) 中 的 强度 分 量 比 3 个 带 
噪声 的 RGB 分 量 图 像 中 的 任何 一 个 都 要 平滑 一 些 。 如 式 (6. Ee 的 那样 , 这 是 由 亮度 图 像 是 RGB 图 像 
的 平均 这 一 事实 造成 的 (回忆 2.6.3 节 中 关于 对 图 像 进行 平均 操作 降低 随机 噪声 的 讨论 ) 。 

RGB 通道 受 噪声 影响 的 情况 下 , 到 HSI 的 转换 才 将 噪声 扩散 到 所 有 HSI 分 量 图 像 . 图 6.50 (a) 

一 个 例子 。 图 6.50 (a) 显示 了 一 幅 RGB 图 像 ， 其 绿色 图 像 被 椒盐 噪声 污染 ， 其 中 无 论 是 盐 粒 噪声 还 是 
ko 的 概率 都 为 0.05。 图 6.50(b) 到 图 650(d) 中 的 HSI 分 量 图 像 清楚 地 显示 了 噪声 是 如 何 从 绿色 RGB 通 

道 散布 到 所 有 HSI 图 像 上 上 的。 当然 ,这 是 我 们 不 希望 的 ， 因 为 HSI 分 量 的 计算 会 用 到 RGB 的 所 有 分 量 ， 正 
如 6.2.3 节 所 示 的 那样 - 


eH 出 
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图 6.48 ” (a)~(c) 由 均值 为 0、 方差 为 800 的 高 斯 噪声 污染 的 红 、 绿 
和 蓝 分 量 图 像 ; (d) 最终 的 RGB 图 像 [与 图 6.46(a) 比 较 ] 


apg 
图 6.49 图 6.48(d 中 带 噪 声 的 彩色 图 像 的 HSI 分 量 : (a) 色调 图 像 ，(\b) 饱 和 度 图 像 ;《c) 亮度 图 像 





Reta 


abcd 
16.50 (a) 绿 平面 被 板 盐 噪 声 污 染 的 RGB AUR; (b) HSI 图 像 的 色调 分 量 ; (c) 饱 和 度 分 量 ; (d) 亮度 分 量 

迄今 为 止 我 们 讨论 过 的 处 理 都 是 正确 的 ， 因 此 全 彩色 图 像 滤波 可 以 在 每 幅 图 像 的 基础 上 执 
行 ， 或 依靠 该 过 程 直接 在 彩色 向 量 空 间 中 执行 。 例 如 ， 用 均值 滤波 器 减少 噪声 是 6.6.1 节 讨 论 过 
的 处 理 方法 ， 我们 知道 ， 在 向 量 空间 中 对 分 量 图 像 单独 进行 类 似 的 处 理 时 ， 可 以 给 出 相同 的 结 
东 。 然 而 ， 其 他 滤波 需 却 不 能 按 这 样 的 方式 明确 表达 。 这 样 的 例子 包括 5.3.2 节 中 讨论 过 的 各 类 
排序 统计 滤波 。 例 如 ， 要 在 彩色 向 量 空 间 实 现 中 值 滤波 ， 就 要 找到 一 种 使 得 中 值 有 意义 的 向 量 
排序 方案 。 处 理 标 量 的 过 程 很 简单 ， 而 处 理 向 量 的 过 程 相 当 复杂 。 向 量 排序 超出 了 此 处 的 讨论 
范围 ,但 Plataniotis and Venetsanopoulos[2000] 是 关于 向 量 排序 和 某 些 基于 排序 概念 的 滤波 的 较 好 
参考 书 。 


6.9 彩色 图 像 讨 缩 


因为 描述 彩色 所 要 求 的 比特 数 比 描述 灰 度 级 所 要 求 的 比特 数 大 3~4 倍 ， 所 以 数据 压缩 在 存储 和 传 
输 彩 色 图 像 中 起 着 核心 的 作用 。 对 于 前 几 节 中 描述 的 RGB, CMY(K) 和 HSI 图 像 ， 任 何 压缩 对 象 的 数 
据 是 每 个 彩色 像素 的 分 量 ( 即 RGB 图 像 中 各 像素 的 红 、 绿 、 蓝 分 量 ) ;它们 是 传达 彩色 信息 的 方式 。 
A) 压缩 是 减 小 或 消除 元 余 和 威 不 相干 数据 的 处 理 ， 虽 然 压 缩 是 第 8 章 的 主题 , 但 我 们 在 下 面 的 例子 中 用 
476| 一 幅 彩 色 图 像 来 简单 地 说 明 这 一 概念 。 
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“” 例 6.18 ”彩色 图 像 压 缩 实例 。 < 

图 6.51(a) 显示 了 蝴蝶 花 的 一 幅 24 比特 RGB 全 彩色 图 像 图 像 中 表示 红 、 绿 、 蓝 分 量 时 都 使 用 了 8 
Hct 651 (6) Rah 651 O 所 示 图 像 的 一 种 压 绽 方 案 重 建 的 图 像 ， 事实 上 ， 该 图 像 是 压缩 并 解压 缩 后 
的 一 种 近似 。 虽 然 压缩 后 的 图 像 不 能 直接 显示 一 一 在 输入 到 彩色 监视 器 之 前 必须 解压 缩 , 但 对 于 原 图 像 中 
每 230 比特 的 数据 ,压缩 后 的 图 像 仅 包含 1 个 数据 比特 (只 需要 1 个 存储 比特 ) ,假定 压缩 后 的 图 像 在 Internet 
上 能 于 1 分 钟 内 传输 完成 ,那么 原 图 像 的 传输 至 少 需要 4 小 时 。 当 然 ， 传 输 后 的 数据 必须 解压 缩 后 才能 观 
看 ,但 解压 缩 在 几 秒 之 内 就 可 以 完成 。 用 于 生成 图 6.51(b) 的 JPEG 2000 压缩 算法 是 近来 引入 的 标准 ， 该 
标准 将 在 8.2.10 节 中 详细 叙述 。 注意 ， 重 建 的 近似 图 像 稍微 有 点 模糊 。 这 是 许多 有 损 压 缩 技术 的 特点 ; 我 
们 可 以 通过 改变 压缩 程度 





各 模 购 减 小 或 消除 。 





图 651 彩色 图 像 压 缩 ，(a) 原 RGB 图 像 ，(b) 图 (a) 压缩 并 解压 缩 后 的 图 像 
小 结 


本 章 简单 地 介绍 了 彩色 图 像 处 理 ， 所 涵盖 的 主题 为 图 像 处 理 技术 提供 了 坚实 的 背景 知识 。 彩 色 基 
本 原理 和 彩色 模型 是 彩色 图 像 处 理 领域 的 基本 内 容 ， 这 些 内 容 在 技术 范围 和 应 用 领域 方面 非常 宽泛 。 
我 们 特别 关注 了 彩色 模型 ， 它 们 不 仅 在 数字 图 像 处 理 中 非常 有 用 ， 而 且 还 为 图 像 处 理 领 域 的 深入 研究 
提供 了 必要 的 工具 。 单 幅 图 像 的 伪 彩 色 和 全 彩色 处 理 的 讨论 ， 为 第 3 章 到 第 5 章 中 的 某 些 技术 提供 了 
纽带 。 

在 探讨 彩色 向 量 空间 时 ， 首先 介 绍 了 以 前 研究 的 方法 ， 突 出 了 灰 度 和 全 彩色 处 理 间 的 重要 区 别 。 
就 技术 而 论 ， 直 接 进 行 彩色 向 量 处 理 的 领域 很 多 ， 且 包括 许多 方法 ， 如 中 值 滤波 和 其 他 排序 滤波 、 目 
适应 和 形态 学 滤波 、 图 像 复 原 、 图 像 压 缩 等 。 这 些 处 理 不 同 于 在 彩色 图 像 的 各 幅 分 量 图 像 上 执行 的 彩 
色 处 理 。 下 节 中 的 参考 文献 提供 了 该 领域 的 深入 研究 成 果 。 

在 彩色 图 像 的 噪声 处 理 方面 ， 我 们 遵循 彩色 图 像 从 一 种 工作 空间 变换 至 另 一 种 工作 空间 的 事实 ， 
指出 了 问题 的 向 量 性 质 ， 以 及 降低 噪声 的 方法 。 在 某 些 情况 下 ， 噪 声 的 滤 除 可 以 在 每 幅 图 像 的 基础 上 
进行 ; 但 另 一 方面 ， 如 中 值 滤波 ， 就 要 求 特殊 处 理 ， 以 便 反 映 彩 色 像 素 是 向 量 这 一 事实 ， 就 像 前 几 段 
中 提 到 的 那样 。 

虽然 分 割 是 第 10 章 的 主题 ， 图 像 数据 压缩 是 第 8 章 的 主题 ,但 在 本 章 中 介绍 它们 有 利于 我 们 保 
持 知 识 的 连续 性 。 后 续 的 讨论 将 表明 ， 这 些 章节 中 介绍 的 许多 技术 同样 适用 于 本 章 的 讨论 。 


参考 文献 


色彩 学 的 全 面 参考 见 Malacara[2001]。 关 于 彩色 生理 学 ， 请 参阅 Gegenfurtner and Sharpe[1999]。 


476 


这 两 个 参考 文献 与 Walsh[1958] 和 Kiver[1965] 一 起 ， 为 6.1 节 的 讨 ; 仑 提供 了 丰富 富 的 补充 材料 。 彩 色 模 ws 
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型 ( 见 6.2 节 ) 的 深入 读物 见 Fortner and Meyer[1997]、Poynton[1996] 和 Fairchild [1998]。6.2.3 节 中 HSI 
模型 的 详细 推导 , 见 Smith[1978], 也 可 查阅 本 书 的 网 站 。 伪 彩色 这 一 主题 ( 见 6.3 节 ) 与 数据 可 视 化 这 
一 通用 领域 联系 紧密 。 在 伪 彩 色 的 应 用 方面 ，Wolff and Yaeger[1993] 是 很 好 的 基础 参考 文献 ，Thorell 
and Smith[1990] 也 很 重要 。 关 于 彩色 信号 向 量 表 示 的 讨论 (6.4 节 ) ， 见 Plataniotis and Venetsanopoulos 
[2000]. 

6.5 节 的 参考 文献 是 Benson[1985]、Robertson[1977] 和 CIE[1978]， 还 可 参阅 MacAdam[1942]。 彩 色 图 
像 滤波 方面 的 内 容 ( 见 6.6 节 ) 是 以 6.4 节 介绍 的 向 量 公 式 及 第 3 章 讨论 的 空间 滤波 为 基础 的 。 彩 色 图 像 分 割 
( 见 6.7 节 ) 是 过 去 10 年 间 备 受 关注 的 主题 -Liu and Yang[1994] 和 Shafarenko et al.[1998] 是 这 一 领域 的 代表 性 
文献 。IEEE 图 像 处 理学 报 的 专刊 [1997] 也 是 重要 的 参考 资料 。 彩 色 边 缘 检测 的 讨论 ( 见 6.7.3 节 ) 来 自 Di 
Zenzo[1986]。 Plataniotis and Venetsanopoulos[2000] 在 综述 彩色 图 像 分 割 的 各 种 方法 方面 做 了 很 好 的 工作 。6.8 
节 的 讨论 以 5.2 节 中 介绍 的 噪声 模型 为 基础 。 图 像 压 缩 ( 见 6.9 节 ) 方 面 的 文献 列 在 第 8 章 的 末尾 。 本 章 讨论 
的 许多 技术 的 软件 实现 见 Gonzalez, Woods and Eddins[2004]. 


:S 标 有 星 号 的 习题 的 详细 解答 ， 


718 ii hy 到 。 站 还 包 
“ee 人 有 由 fy。 
6.1 给 出 用 于 产生 图 6.5 中 标 为 “日 光 ” 的 点 的 红 光 、 绿 光 、 蓝 光 的 百分比 。 
%6.2 ”考虑 任何 两 种 有 效 颜色 cl 和 ce, 其 在 图 6.5 所 示 色 度 图 中 的 坐标 分 别 为 Co, NC y) 推导 出 计算 
构成 一 种 给 定 颜色 的 cl 和 c 的 相对 百分比 的 通用 表示 式 ， 已 知 给 定 的 颜色 位 于 连接 这 两 种 颜色 的 
直线 上 。 
6.3 ”考虑 任何 4 种 有 效 彩 色 cl cy 6 和 cy, FE 6.5 所 示 色 度 图 中 的 坐标 为 Co y), Ge, ads Ca yA, 4) 5 
推导 出 计算 构成 给 定 彩色 的 ci, cx c3 和 cs 的 相对 百分比 的 通用 表达 式 ， 已 知 给 定 的 颜色 位 于 由 4 个 
项 点 c1,c,c3 和 6 构成 的 方形 内 。 
x64 在 一 条 自动 装配 线 中 ,为 了 简化 检测 ， 四 类 零件 将 编 以 彩色 码 。 但 只 有 一 台 黑 白 电视 摄像 机 可 用 于 
获取 数字 图 像 。 请 提出 一 种 使 用 该 摄像 机 检测 4 种 不 同 颜色 的 技术 。 
6.5 在 一 幅 简 单 的 RGB ERP, R, G 和 8B 分 量 图 像 有 下 图 所 示 的 水 平 强度 分 布 曲线 。 人 们 在 该 图 像 的 
中 间 一 列 能 看 到 什么 颜色 ? 











0 ' N2 N-1 0 NA N/2 
fir it 位 置 位 置 
友 6.6， 当 它们 出 现在 单 色 监视 器 上 时 ， 画 出 右 侧 图 像 的 RGB 分 量 。 所 有 颜色 都 处 在 最 大 亮度 与 饱和 度 。 
在 解答 这 一 习题 时 ， 考 虑 作为 图 像 一 部 分 的 中 间 灰 度 边 界 。 
6.7 在 彩色 RGB 系统 中 ,每 幅 RGB 图 像 均 为 12 比特 图 像 ， 共 有 多 少 种 不 
同 的 灰 度 ? 
6.8 考虑 图 6.8 所 示 的 RGB 彩色 立方 体 并 回答 下 列 问题 : 
* (a) 描述 在 R，G 和 B 原 图 像 中 灰 度 级 是 如 何 变化 的 。 原 图 像 由 彩色 立 
方 体 的 前 表面 组 成 。 
(b) 假设 用 CMY 彩色 代替 RGB 立方 体 中 的 每 种 颜色 ， 这 个 新 立方 体 显示 在 RGB 监视 器 上 。 请 用 
彩色 名 标注 在 屏幕 上 看 到 的 新 立方 体 的 8 个 顶点 。 
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x (a) 给 出 色调 图 像 中 所 有 区 域 的 灰 度 值 。 
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(c) 请 说 明 与 饱和 度 有 关 的 RGB 彩色 立方 体 边缘 上 的 彩色 。 
(a) 当 习 题 6.6 中 的 图 像 出 现在 单 色 监视 器 上 时 ， 请 画 出 该 图 像 的 CMY 分 量 。 

(b) 如 果 (a) 中 画 出 的 CMY 分 量 分 别 送 入 监视 器 的 红 、 绿 、 蓝 输入 端 ， 试 描述 结果 图 像 。 

从 式 (6.5-5) 中 的 RGB 亮度 映射 函数 推导 出 式 (6.5-6) 的 CMY 亮度 映射 函数 。 

考虑 如 图 6.10 (a) 所 示 的 整个 216 种 稳定 色 阵列 , 按 ( 行 , 列 ) 方 式 标 出 每 一 元 素 , 左 上 角 元 素 为 (1, 1), 
右 下 角 元 素 为 (12, 18)。 请 问 在 哪个 元 素 会 找到 

(a) 最 纯 的 红色 ? 

(b) 最 纯 的 黄色 ? 

当 习 题 6.6 中 图 像 的 HSI 分 量 出 现在 单 色 监视 器 上 时 ， 画 出 这 些 分 量 。 

提供 一 种 方法 ， 以 生成 一 个 与 图 6.2 中 称 为 “可 见 光谱 ”的 放大 部 分 相似 的 彩色 波段 。 注 意 该 波段 
左边 从 暗 紫色 开始 ， 并 向 右边 的 纯 红色 延续 。 (提示 : 使 用 HSI 彩色 模型 。) 

提出 一 种 生成 图 6.13 (c) 中 以 图 形 方 式 显示 的 图 像 的 彩色 方案 的 方法 , 并 以 流程 图 的 方式 给 出 答案 
假定 亮度 值 固定 且 已 给 定 。( 提 示 : 使 用 HSI 彩色 模型 。) 

考虑 右 下 方 由 纯色 方形 组 成 的 图 像 。 为 讨论 你 的 答案 , 选择 由 0~7 的 8 个 灰 度 组 成 的 灰 度 级 ， 其 中 
0 表示 黑 ，7 表示 白 。 假 设 该 图 像 转 换 到 HSI 彩色 空间 。 如 果 使 用 的 数字 有 意义 ， 在 回答 如 下 问题 
时 ， 对 灰 度 使 用 一 个 明确 的 数字 。 和 否则 ， 使 用 “与 …… 相 同 ”、“ 比 …… 亮 ”或 “ 比 …… 暗 ”的 关 
系 就 已 足够 。 如 果 不 能 对 正 讨论 的 图 像 赋予 一 种 特定 的 灰 度 级 或 这 些 关系 之 一 ， 试 给 出 原因 。 

(a) 画 出 色调 图 像 的 草图 。 

(b) 画 出 饱和 度 图 像 的 草图 。 

(c) 画 出 亮度 图 像 的 草图 

下 列 8 比特 图 像 ( 从 左 到 右 ) 是 来 自 图 6.16 的 H, S, 7 分量 图 像 。 数 字 
省 出 了 灰 度 值 。 回 答 下 列 问 题 ,解释 回答 的 依据 。 如 果 基 于 给 定 的 
信息 不 可 能 回答 这 一 问题 ， 则 陈述 为 什么 不 能 回答 。 











(b) 给 出 饱和 度 图 像 中 所 有 区 域 的 灰 度 值 。 
(c) 给 出 亮度 图 像 中 所 有 区 域 灰 度 值 。 





(a) (b) 
参考 图 6.27 回答 下 列 问题 : 
(a) 为 什么 图 6.27( 中 的 图 像 主 要 呈现 红色 调 ? 
(b) 提出 一 种 自动 编码 程序 ， 使 图 6.27 中 的 水 为 亮 蓝 色 。 
(c) 提出 一 种 自动 编码 程序 ， 使 主要 的 人 工分 量 呈 现 亮 红色 。 [ 提示 : 使 用 图 6.27(f) 。] 
证 明 彩 色 图 像 的 补 色 的 饱和 度 分 量 ， 不 能 单独 地 由 输入 图 像 的 饱和 度 分 量 计算 出 来 。 
使 用 HSI 彩色 模型 说 明 图 6.33 (b) 中 的 近似 补 色 的 色调 变换 函数 的 形状 。 
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推导 产生 一 幅 彩 色 图 像 的 补 色 的 CMY 变换 。 

画 出 用 于 校正 RGB 彩色 空间 中 过 度 对 比 度 的 变换 函数 的 一 般 形状 。 

假定 一 个 成 像 系 统 的 监视 器 和 打印 机 未 完美 校准 。 在 该 监视 器 上 看 起 来 平衡 的 一 幅 图 像 打印 时 出 现 
了 青色 。 描 述 可 校正 这 种 不 平衡 的 通用 变换 。 


假定 
X | |0.588 0.179 0.183 | R 
=| 0.29 0.606 0.105 || G 
Z 0 0.068 1.021 || B 














计算 习题 6.6 中 图 像 的 Z*a*b* 分 量 。 该 矩阵 方程 定义 了 由 (美国 ) 国 家 电视 标准 委员 会 (NTSC) 彩色 

电视 荧光 粉 产生 的 在 D65 标准 照明 下 观看 的 彩色 三 色 激 励 值 (Benson[1985]) 。 

怎样 才能 实现 与 3.3.2 节 中 匹配 (规定 ) 的 灰 度 直方 图 等 效 的 彩色 直方 图 ? 

考虑 下 列 500 x 500 的 RGB 彩色 图 像 , 图 像 中 方 框 是 完全 饱和 的 红色 、 绿色 和 蓝 色 , 且 每 种 颜色 处 

在 最 大 亮度 [ 例如， 对 于 红色 方 框 是 (1, 0, 0) ] 。 由 该 图 像 生成 了 一 幅 HSI 图 像 。 

(a) 描述 每 幅 HSI 分 量 图 像 的 外 观 。 

(b) 用 一 个 250 x 250 的 平均 模板 来 平滑 HSI 图 像 的 饱和 度 分 量 ,描述 结果 的 外 观 
(可 忽略 滤波 操作 对 图 像 边界 的 影响 ) 。 

(c) 对 色调 图 像 重复 (b) 。 

证 明 当 C=7( 单 位 和 矩阵) 时 ， 式 (6.7-2) 简化 为 式 (6.7-1) 。 





6.27 太 (a) 参考 6.7.2 节 的 讨论 ，( 以 流程 图 形式 ) 给 出 一 个 过 程 , 确定 彩色 向 量 (点 )z 是 否 在 一 个 边 长 为 刺 ， 


6.28 


6.29 


中 心 在 平均 彩色 向 量 & 处 的 立方 体内 部 。 不 允许 计算 距离 。 
(b) 如 果 盒子 (立方 体 ) 与 坐标 轴 是 对 齐 的 ， 那 么 可 对 各 幅 图 像 进行 这 一 处 理 。 说 明 你 应 该 怎么 做 。 
画 出 满足 方程 


DC, a) = [(z- a)" C`- a)]? = Dy 
的 那些 点 在 RGB 空间 中 组 成 的 表面 ， 其 中 DEANE ERA BE a=0 H. 
800 
c=|010 


001 





BF 6.7.3 节 , 你 也 许 会 想到 ,在 任何 点 Ce 处 定义 一 幅 RGB 图 像 的 梯度 的 逻辑 方法 , 是 计算 每 幅 
分 量 图 像 的 梯度 向 量 ( 见 3.6.4 节 ) ， 然 后 把 这 3 个 单独 的 梯度 向 量 相 加 ， 形 成 该 彩色 图 像 的 梯度 向 
量 。 遗 垮 的 是 ， 有 时 这 一 方法 会 导致 错误 的 结果 。 特 别 是 ， 对 于 明确 定义 了 边缘 的 彩色 图 像 ， 具 有 
零 梯度 是 可 能 的 。 如 果 使 用 这 一 方法 ， 请 给 出 这 样 一 幅 图 像 的 例子 。 (提示 : 为 简化 分 析 ， 可 置 一 
个 彩色 平面 为 恒定 值 。) 






e guard was looking at her, first through a telescope, 
į microscope, and then through an opera glass. 


Lewis Carrol, Through the Looking Glass 


虽然 自 20 世纪 50 ERRE, 健 里 叶 变 换 就 一 直 是 基于 变换 的 图 像 处 理 的 基石 , 但 近年 来 一 
种 新 的 称 为 小 波 交 换 的 变换 使 得 压缩 、 传 输 和 分 析 图 像 变 得 更 为 容易 。 与 基 函 数 为 正弦 函数 的 
傅 里 叶 变换 不 同 ， 小 波 变换 的 基 函 数 是 小 型 波 ， 称 为 小 波 ， 它 具有 变化 的 频率 和 有 限 的 持续 时 
间 。 这 就 使 得 它们 为 图 像 提供 一 张 等 效 的 乐谱 ， 该 乐谱 不 但 显示 了 要 演奏 的 音符 (或 频率 ) ， 而 
且 显 示 了 演奏 这 些 音符 的 时 间 。 另 一 方面 ， 传 里 叶 变换 只 提供 音符 或 频率 信息 ， 时 间 信 息 在 变 
换 过 程 中 则 丢失 了 。 

1987 年 ， 人 们 首次 证 明 小 波 是 多 分 辩 率 理论 这 种 信号 处 理 和 分 析 方 法 的 基础 (Mallat [1987]) 。 多 
分 辩 率 理论 有 效 地 统一 了 多 个 学 科 的 技术 ， 包 括 来 自信 号 处 理 的 子 带 编码 、 来 自 数 字 语 音 识别 的 正 交 
镜像 滤波 及 金字 塔 图 像 处 理 。 如 其 名 称 所 示 ， 多 分 辩 率 理论 涉及 多 个 分 辩 率 下 的 信和 号 (或 图 像 ) 表示 与 
分 析 。 这 种 方法 的 优势 很 明显 ， 某 种 分 辨 率 下 无 法 检测 的 特性 ， 在 另 一 种 分 辩 率 下 会 很 容易 检测 。 尽 
管 20 世纪 80 年 代 末 之前， 图 像 处 理 界 对 多 分 辨 率 分 析 的 研究 兴趣 有 限 ， 但 现在 关于 该 专题 的 论文 和 
专著 却 多 得 数不胜数 。 

本 章 从 多 分 辩 率 的 角度 来 审视 基于 小 波 的 变换 。 虽 然 这 样 的 变换 也 可 使 用 其 他 方法 来 介绍 ， 但 这 
种 方法 能 简化 它们 的 数学 和 物理 解释 。 我 们 首先 概述 影响 多 分 辨 率 理论 形成 的 图 像 处 理 技术 ， 以 便 在 
图 像 处 理 环 境 中 阐述 这 一 理论 的 基本 概念 ， 同 时 对 该 方法 及 其 应 用 进行 简要 的 历史 回顾 。 本 章 的 主要 
内 容 集中 于 离散 小 波 变换 的 开发 和 利用 。 为 阐明 小 变换 的 用 途 ， 本 章 提 供 了 图 像 编 码 、 噪 声 去 除 和 边 
缘 检 测 等 例子 。 在 下 一 章 中 ， 小 波 将 主要 用 于 图 像 压 缩 ， 因 为 小 波 在 图 像 压 缩 中 的 应 用 已 得 到 了 人 们 
的 充分 重视 。 


我 们 观察 图 像 时 ,看 到 的 通常 是 由 相似 纹理 和 灰 度 级 连 成 的 区 域 ， 它们 相 结合 就 形成 了 物体 。 
如 果 物 体 的 尺寸 较 小 或 对 比 度 较 低 ， 那 么 我 们 通常 以 较 高 的 分 辨 率 来 研究 它们 ; 如 果 物 体 的 尺寸 
较 大 或 对 比 度 较 高 ， 则 粗略 的 观察 就 已 足够 。 如 果 较 小 物体 和 较 大 物体 〈 或 对 比 度 较 低 和 对 比 度 
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较 高 的 物体 ) 同时 存在 ， 那 么 以 不 同 分 辩 率 来 研究 它们 将 更 具 优势 。 当 然 ， 这 就 是 多 分 辨 率 处 理 
从 数学 角度 来 看 ， 图 像 是 具有 局 部 变化 统计 特性 灰 度 值 的 二 维 阵列 ， 而 这 种 统计 特性 是 由 类 似 边 


缘 和 对 比 同 质 区 域 突变 特性 的 不 同 组 合 导致 的 。 如 图 7.1 所 示 〈 本 章 剩 ia 
可 能 变化 很 明显 , 这 就 使 得 为 整 幅 图 像 建立 统计 模型 非常 困难 , 甚至 不 
可 能 建立 统计 模型 。 


7.1.1 图 像 金字 塔 


以 多 个 分 辩 率 来 表示 图 像 的 一 种 结构 是 图 像 金字 塔 ， | 
这 种 结构 非常 有 效 , 目 概 念 简单 (Burt and Adelson[1983]) 。 
图 像 金字 塔 最 初 用 于 机 器 视觉 和 图 像 压缩 , 是 一 系列 以 金 
字 塔 形状 排列 的 、 分 辨 率 逐 步 降低 的 图 像 集合 。 就 像 在 图 
7.2 (a) 中 看 到 的 那样 ， 金 字 塔 的 底部 是 待 处 理 图 像 的 高 分 
PRION, 而 顶部 则 包含 一 个 低 分 状 率 近似 。 向 金字 塔 上 
层 移动 时 ， 尺 寸 和 分 状 率 逐步 降低 。 基 础 级 本 的 大 小 为 。 图 71 一 幅 图 像 及 其 不 同 的 局 部 直方 图 
2’ x2’ 或 NxN ,其 中 J=log; N ,顶点 级 0 的 大 小 为 1x1( 即 单个 像素 ) ,通常 第 j 级 的 大 小 为 2 x2 , 
其 中 0 <j <Je 虽然 图 7.2 (a) 所 示 的 金字 塔 由 从 2 x 27 BI 2° x 2° 的 .+1 个 分 辩 率 级 别 组 成 , 但 大 部 分 
图 像 金字 塔 会 截 短 到 P+1 级 , 其 中 1< P<J 且 j=J-P,…,J 一 2,J=1,J 。 也 就 是 说 ,我 们 通常 会 将 
级 别 限制 到 了 来 降低 原 图 像 的 分 状 率 近似 ; 例如 ， 一 幅 大 小 为 512x512 的 图 像 的 1x1( 即 单 像素 ) 近 似 
没有 什么 价值 。P+1 级 金字 塔 (P >0 ) 中 的 像素 总 数 是 


vt A ++ z] 4 yy2 
(4) 4) (4) 3 

图 7.2(b) 显示 了 一 个 简单 的 系统 ， 该 系统 构 了 两 个 紧密 联系 的 图 像 金字 塔 。 第 /一 1 级 近似 输出 提 
供 建立 一 个 近似 值 金字 塔 所 需 的 图 像 ( 如 前 一 段 中 描述 的 那样 )， 第 .级 预测 残 差 输出 构建 一 个 补充 的 
预测 残 差 金字 塔 。 与 近似 金字 塔 不 同 ,预测 残 差 金字 塔 仅 包含 输入 图 像 (eae yc 
的 一 个 分 辨 率 降低 的 近似 (在 金字 塔 的 项 部 ， 即 J -PP 级) 。 所 有 其 他 级 | 图像 与 该 幅 图 像 的 一 个 预测 版 本 间 
均 包含 预测 残 差 , 其 中 第 j 级 预测 残 差 (对 于 J 一 P+1<j < 定义 为 第 | Mize. 如 82.9 节 将 说 明 的 那样 ， 与 
让 级 近似 ( 方 框图 的 输入 ) 与 基于 第 j 一 1 级 近似 方 框图 中 的 近似 输出 ) | on 全 本 
的 第 j 级 近似 的 估计 之 间 的 差 。 

如 图 7.2(b) 建议 的 那样 ， 近 似 和 预测 残 差 金字 塔 都 以 一 种 迭代 方式 进行 计算 。 在 第 一 次 迭代 前 ， 
以 金字 塔 形 式 描绘 的 图 像 放 在 这 个 近似 金字 塔 的 第 J 级 中 。 然 后 ,下 面 的 3 步 过 程 执行 已 次 ， 其 中 
j= Pyl 


步骤 1 计算 第 j 级 输入 图 像 分 辨 率 降 低 的 近似 [ 图 7.2(b) 所 示 方 框图 左 侧 的 输入 ]。 这 可 通过 渡 
波 并 对 滤波 后 的 结果 以 2 为 基 进 行 下 采样 来 完成 。 这 两 种 操作 将 在 下 一 段 中 描述 。 将 得 到 的 近似 
放 在 近似 金字 塔 的 第 j 一 1 级 。 

步骤 2 由 步骤 1 产生 的 分 辩 率 降低 的 近似 ， 创 建 第 /7 级 输入 图 像 的 一 个 估计 。 方 法 是 对 产 
生 的 近似 与 第 7 级 图 像 进行 上 采样 和 滤波 ( 见 下 节 ) 。 得 到 的 预测 图 像 与 第 j 级 输入 图 像 的 维 
数 相同 。 
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1x 1 eg OR s 






SB i — 1 级 近似 


第 /级 输入 图 像 


© )}—- 第 /级 预测 残 差 


图 7.2 (a) 一 个 图 像 金 字 塔 ;(b) 创 建 近似 和 预测 残 差 金字 塔 的 一 个 简单 系统 


步骤 3 计算 步骤 2 的 预测 图 像 和 步骤 1 的 输入 之 间 的 差 。 把 得 到 的 结果 放 在 预测 残 差 金字 塔 的 
第 j 级 。 


忆 次 迭代 后 的 结论 即 随后 的 迭代 中 j =. P+1) 表 明 ,第 了 -级 近似 输出 放 在 预测 残 差 金字 塔 
的 第 /一 己 级 处 。 如 果 不 需 要 预测 残 差 金字 塔 ， 则 这 些 操作 连同 步 又 2、 步骤 3、 上 采样 器 、 内 插 滤波 
器 以 及 图 7.2 (b) 中 的 加 法 器 都 可 以 省 略 。 

多 种 近似 和 内 播 滤波 器 可 以 合并 到 图 72(b) 所 示 的 系统 中 。 滤 波 通 常 在 空间 域 执行 ( 见 34 节 ) 。 有 用 
的 近似 滤波 技术 包括 : 邻 域 平均 ( 见 3.5.1 节 )， 它 产生 平均 人 金字塔; 低 通 高 斯 渡 波 ( 见 4.7.4 WA 483 
节 ), 它 产生 高 斯 金字 塔 ; 不 过 滤 ， 它 产生 子 取样 金字 塔 。2.4.4 节 中 描述 的 任何 内 插 方 法 ,包括 最 近邻 、 
双 线性 和 双 三 次 内 插 , 都 可 以 合并 到 内 插 滤 波 器 中 。 最 后 , 我 们 注意 到 ， 
图 72(b) 中 的 上 采样 和 下 采样 方 框 用 于 加 倍 和 减 半 计算 得 到 的 近似 及 “| poo 在 ek 
预测 图 像 的 空间 维 数 。 给 定 一 个 整数 变量 n 和 一 维 取样 序列 f(n) ， 则 | 图像, 之 外 ， 其 他 以 x yz，… 表 


上 和 采样 序列 Ar) 如 下 式 定义 : ee Ti i j, k, l, m, 
_ [f(n/2), n JARKI 
Am=| 0, 其 他 (7.1-1) 
其 中 ， 如 下 标 表示 的 那样 ， 上 采样 以 2 为 基数 。 基 2 下 采样 的 互补 操作 定义 为 
fy, (n) = f (2n) GTA 


上 采样 可 视 为 在 序列 中 的 每 个 样本 后 插入 0; 下 采样 可 视 为 每 隔 一 个 样本 就 丢弃 一 个 样本 。 图 7.2 (b) 中 分 
别 以 标 为 2 + 的 上 采样 和 标 为 24 的 下 采样 方 框 来 注释 ， 指 出 三 维 输入 的 行 和 列 ， 其 中 它们 的 操作 就 
是 上 采样 和 下 采样 。 与 4.11.1 节 中 可 分 的 二 维 DET 一样 , 二 维 上 采样 和 下 采样 可 依次 通过 式 (7.1-1) 
和 式 (7.1-2) 定义 的 一 维 操作 来 执行 。 i 
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例 7.1 近似 金字 塔 和 预测 残 差 金 字 塔 。 

图 7.3 显示 了 图 7.1 中 花瓶 的 近似 金字 塔 和 预测 残 差 金字 塔 。 产 生 图 7.3 (a) 中 的 4 级 近似 金字塔 时 ， 
使 用 了 一 个 低 通 高 斯 平滑 滤波 器 ( 见 4.7.4 节 ) 。 如 看 到 的 那样 ， 得 到 的 金字 塔 包含 512 x 512 分 辩 率 的 原 图 
像 (底部 ) 和 3 个 低 分 辩 率 的 近似 图 像 分辩 率 分 别 为 256x256， 128x128 和 64x64) 。 这 样 ， 忆 就 是 3， 出 现 
级 别 9, 8,7 和 6, BANAT REFFTE log, (512)+1 级 或 10 级 。 注意 , 金字 塔 的 分 辩 率 越 低 ,伴随 的 细节 就 越 少 。 
例如 , 第 6 级 ( 即 64x64) 近似 图 像 很 适合 于 窗口 定位 〈 即 取景 窗 ) ， 但 不 适合 于 寻找 植物 的 蕉 - 通常 , 金字 
塔 的 低 分 辩 率 级 别 用 于 分 析 较 大 的 结构 或 图 像 的 整体 内 容 ; A EEA ED ITE ENHE. 
这 种 由 粗 到 细 的 分 析 策 略 在 模式 识别 中 特别 有 用 。 

图 7.3(b) 中 的 双 线 性 内 插 滤波 器 用 于 产生 预测 残 差 金字 塔 。 不 存在 量化 误 关 时 ， ee eve 
塔 可 用 于 产生 图 7.3 (a) 中 的 互补 近似 金字 塔 ， 包 括 没有 误差 的 原 图 像 。 要 做 到 这 一 点 ,我 们 用 第 6 级 的 
64 x 64 近似 图 像 (该 预测 残 差 金字 塔 中 唯一 的 近似 图 像 ) ,来 预测 第 7 级 的 128x128 分 辩 率 近似 图 像 (通过 
上 采样 和 滤波 实现 ) ， 并 加 上 第 7 级 预测 残 差 。 重 复 使 用 这 个 过 程 来 计算 近似 图 像 ， 直 到 生成 512x512 的 
原 图 像 。 注 意 ， 图 7.3 (b) 中 的 预测 残 差 直方 图 在 零点 附近 有 一 个 高 峰 ， 而 图 7.3 (a) 中 的 近似 直方 图 中 则 没有 
高 峰 , 与 近似 图 像 不 同 的 是 , 预测 残 差 图 像 可 以 通过 给 更 多 的 可 能 值 分 配 较 少 的 比特 数 来 实现 高 度 压 缩 ( 见 8.2.1 
节 的 变 长 编码 ) 。 最 后 , 我 们 注意 到 ; 图 7.3 (b) 中 的 预测 残 差 被 缩放 到 了 使 较 小 预测 误差 更 明显 的 程度 ， 但 
预测 残 差 直方 图 是 以 第 128 级 表示 0 误差 的 原始 残 差 值 为 基础 的 。 





图 凶 中 的 近似 金字 塔 称 为 高 斯 金 | 
字 塔 ， 因 为 构建 该 金字 塔 时 使 用 了 一 | 
个 高 斯 滤波 器 。 图 (b) 中 的 预测 残 差 金 
字 塔 通常 称 为 拉 普 拉 斯 金字 塔 ;! 注意 
其 与 第 3 章 中 使 用 拉 普 拉 斯 算 子 滤波 
后 得 到 的 图 像 的 相似 性 。 





















图 73 两 种 图 像 金 字 塔 及 它们 的 直方 图 ，(a) 近似 金字 塔 ， (b) 预测 残 差 金字 塔 
7.1.2 子 带 编码 


另 一 种 与 多 分 辩 率 分 析 相关 的 重要 图 像 处 理 技术 是 子 带 编码 。 在 子 带 编码 中 ， 一 幅 图 像 被 分 解 为 
一 组 频带 受 限 的 分 量 ， 称 为 子 带 。 由 于 执行 了 分 解 ， 所 以 子 带 可 以 重组 在 一 起 ， 无 误差 地 重建 原始 图 
像 。 因为 分 解 和 重建 是 借助 于 数字 滤波 器 实现 的 , 所 以 我 们 的 讨论 从 数 | 
字 信 号 处 理 (DSP) 和 数字 信号 滤波 的 简介 开始 。 的 输入 序列 , 并 反映 了 数字 信号 滤波 | 

考虑 图 7.4(a) 中 的 简单 数字 滤波 器 , 并 注意 到 它 是 由 三 个 基本 部 件 | 中 输入 通常 是 一 个 取样 后 的 模拟 信 | 

组 成 的 , 即 延迟 单元 、 乘 法 器 和 加 法 器 。 沿 这 个 滤波 器 的 顶部 , 依次 连 [PAE 

接 延 迟 单元 ， 建 立 输 入 序列 f(n) 的 K-1 延迟 ( 即 右 移 ) 形 式 。 例 如 ， 延 迟 序列 f(n-2) 为 
88 
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fO), n=2 


T=] py, saaie 


如 图 7.4(a) 中 灰色 注释 指出 的 那样 ， 输 入 序列 f(n) = f(n 一 0) 和 延迟 单元 输出 处 的 KK 一 1 个 延迟 序列 ， 
表示 为 f(n 一 1]),f(n 一 2)…,f(n 一 +1) ,它们 分 别 与 常数 h(0),h(1)…,h(K 一 1) 相 乘 ， 然 后 求 和 ,可 产 
生 滤 波 后 的 输出 序列 : 


f (m= Yh f=) = f(y*h(n) (7.1-3) 


k=-% 









式 中 ， 六 表示 卷 积 。 注 意 ， 除 变量 的 改变 外 ， 式 (7.1-3) 与 第 4 章 中 定 ae MOMENI 
义 离散 卷 积 的 公式 (4.4-10) 相同 。 图 7.4 (a) 和 式 (7.1-3) 中 的 乘 数 玉 称 为 “| 用 0 到 K -1 之 间 的 个 值 来 索引 的 ， 
滤波 系数 。 每 个 系数 定义 一 个 滤波 器 抽 头 , 它 可 视 为 计算 式 (7.1-3) 中 求 | 同 &0.13) 中 的 求 和 限 可 简化 为 0 到 
和 项 所 需要 的 分 量 ， 此 时 称 滤波 器 为 玉 阶 的 。 K -1 [ 像 在 式 (44-10) 中 那样 ] 。 








fa-K+1)) 
fin) 
hA(K = 1)f(n - K + 1) 
ee d iy — >- fin) = f(n) h(n) 
A(O)F(n) AGODF — 1) 
h(O)f(n) + Ain — 1) + Ain- 2) 
二 时 
S, Atk)f(n = k) = fla) x hin) 
k=0 
1 
E = h(K — 1) 
一 = 
= 2i 
RO i- 
5 È 
= 
=f =i 
= | = MA aa da = 4 
n n 


E74 (a) 数字 滤波 器 ; (b) 单 元 离散 冲 激 序列 ; (c) 滤波 器 的 冲 激 响应 
如 果 图 7.4(a) 中 滤波 器 的 输入 是 图 7.4(b) 和 4.2.3 节 中 的 离散 单位 冲 激 ， 则 式 (7.1-3) 变 为 


f(n)= bs h(k)5(n—k) = h(n) (7.1-4) 


k=-œ 


也 就 是 说 ,在 式 (7.1-3) 中 ,将 输入 f(n) 用 5(n) 来 代替 ,并 利用 式 (4.2-13) 
定义 的 离散 单位 冲 激 的 取样 特性 ， 我 们 发 现 图 7.4 (a) 中 滤波 器 的 冲 激 = 
滤波 器 。 


响应 是 ,定义 该 滤波 器 的 滤波 器 系数 的 天 元 素 序列 。 物 理 上 ,单位 肪 


pT) 


A490 
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冲 越过 滤波 器 的 顶端 ， 从 左 到 右 移 动 (从 一 个 单元 延迟 到 下 一 个 单元 延迟 ) ， 产 生 一 个 输出 ， 假 设 该 输 
出 就 是 延迟 冲 激 位 置 处 的 系数 值 。 因 为 有 天 个 系数 ， 所 以 冲 激 响应 的 长 度 为 及， 且 这 种 滤波 器 称 为 有 
限 冲 激 响 应 滤波 器 (FIR) 。 
图 7.5 显示 了 6 个 功能 上 相关 的 滤波 器 的 冲 激 响应 。 图 7.5 (b) 中 的 为 (n) 是 图 7.5 (a) P h (n) 的 符号 
反 转 形式 ( 即 关 于 水 平 轴 反 转 ) B 
h,(n) =—h,(n) (7.1-5) 


i h(n) h(n) = —hy(n) 


h(n) = hy(—n) 











hs(n) = (—1)"hy(n) 








== R 
ov 3 1 2.34 5 6 Ts "3cariO 2 345 6 7.,. 
n n n 


图 7.5 6 个 功能 上 相关 的 滤波 器 的 冲 激 响应 : 〈a) 参 考 响应 ; (b) 符号 反 转 ; 
(c) ~ (a) 顺序 反 转 与 引 和 的 延迟 不 同 ) ; 全 调制 ; 亿 顺 序 反 转 和 调制 


图 7.5(c) FU (d) 中 的 滤波 器 户 (0) FN ha (n) 是 h(n) 的 顺序 反 转 形式 : 





当 输入 序列 是 一 个 取样 后 的 模拟 信 
h(n)=h(-n) (7.1-6) | 号 时 ,顺序 反 转 通常 称 为 时 间 反 转 。 | 
h,(n) = h,(K -1-n) (7.1-7) 


滤波 器 及 (n) 是 及 (n) 关于 垂直 轴 的 映像 ; 滤波 器 及 (n) 是 h(n) 的 映像 和 平移 ( 即 移 位 ) 形 式 。 忽略 平移 ， 
这 两 个 滤波 器 的 响应 是 相同 的 。 图 7.5 (e) 中 的 滤波 器 h(n) 由 下 式 定义 ; 

hs(n) = (-1)"h,(n) (7.1-8) 
它 称 之 为 h(n) 的 调制 形式 。 因 为 调制 改变 了 所 有 奇数 序号 的 系数 的 符号 | 即 图 7.5 (e) 中 为 奇数 的 系 


BH J, h; (1) = —h (1) F h; (3) = Ah (3) , If A, (0) = h (0) Fil h; (2) = h (2) 。 最 后 ,图 7.5 (显示 的 序列 是 h(n) 
的 顺序 反 转 形式 ， 它 也 被 调制 : 


h(n)=(-1)"h(K-1-n) (7.1-9) 
包含 这 个 序列 的 目的 是 为 了 说 明 这 样 一 个 事实 , 即 在 规定 两 个 滤波 絮 之 
间 的 关系 时 ,符号 反 转 、 顺 序 反 转 和 调制 有 时 是 合并 在 一 起 的 。 滤波 器 组 是 两 个 或 两 个 以 上 滤波 





简单 介绍 数字 信号 滤波 后 , 我 们 考虑 图 7.6 (a) 中 的 一 个 两 波段 子 带 | 器 的 集合 。 
编码 和 解码 系统 。 如 图 中 指出 的 那样 ， 该 系统 由 两 个 滤波 器 组 构成 ， 每 个 滤波 器 组 包含 图 7.4(a) 中 所 

O 示 的 两 个 FIR 滤波 器 。 注 意 ，4 个 FIR 滤波 器 中 的 每 个 ， 在 图 7.6 (a) 中 都 被 表示 为 一 个 方 框 ， 方 框 内 
ie 写 出 了 每 个 滤波 器 的 冲 激 响应 (和 卷 积 符号 ) 。 包 含 滤波 器 加 (n) Fil hy (n) 的 分 析 滤波 器 组 用 于 把 输入 序 
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列 分 成 两 个 半 长 序列 fy (2) 和 Ai,(n) ,表示 输入 的 子 带 。 注意 , 滤波 器 h(n) Fil h (n) 是 半 波 段 滤波 器 ， 
它们 的 理想 传递 特性 4 和 到 | 如 图 7.6(b) 所 示 。 滤 波 器 加 (n) 是 一 个 低 通 滤波 器 ， 其 输出 即 子 带 fi,(n) 
PH f(n) 的 近似 ; 滤波 器 有 h(n) 是 一 个 高 通 滤波 器 ， 其 输出 即 子 带 f,(n) 称 为 (n) 的 高 频 部 分 或 细节 
部 分 。 综 合 滤波 器 组 go(n) 和 gi(n) 将 有 i(n) 和 fi,(n) 合并 ， 产 生 f(n) 。 子 带 编码 的 目的 是 ， 选 择 
h(n) h(n), g (mMM gn), VME f(n) = 了 (n)， 即 子 带 编码 和 解码 系统 的 输入 和 输出 是 相同 的 。 完 成 
这 一 任务 时 ， 就 可 以 说 最 终 系统 采用 了 完美 重建 滤波 器 。 


ab fo) 
i+! 


| Hy(@)| [Hi(@)| 


fin) 





3 faln) 


图 7.6 (a) 一 个 二 带子 带 编码 和 解码 系统 ; (b) 频谱 可 分 性 





滤波 器 的 形式 一 一 有 (ERA) ai 要 实现 
完美 重 构 ， 综 合 滤波 器 和 分 析 滤 波 器 的 冲 激 响应 必须 按 如 下 两 种 方式 之 一 关联 起 来 : 
go(n)=(-D)"h(n), g, (1) = CD" h (n) (7.1-10) 
或 
go(n) =(-1)"""A,(n) , g,(n) = (-1)" Ag (n) (7.1-11) 
式 (7.1-10) 和 式 (7.1-11) 中 的 加 (n) ;有 h(n) , o(n) Fl gi (n) 被 视 为 交叉 调制 ， 因 为 在 图 7.6 (a) 所 示 的 方 杠 
图 中 ， 斜 对 着 的 滤波 器 是 由 调制 关联 起 来 的 【调制 因子 是 -(-1? 或 (-D 呈 时 ， 符 号 相反 ]。 此 外 ， 可 
以 看 出 它们 满足 下 列 双 正 交 条 件 : 
(h,(2n—k),g)(k))=5(- jen), i,j ={0, 1} (7.1-12) 
IF, (h,(2n—k),g,(k)) 表示 加 (2n 一 k) 和 gj(k) 的 内 积 "。i 不 等 于 7 时， 内 积 为 0; i 和 j 相等 时 ， 内 
积 是 单位 离散 冲 激 函数 6(n) 。 在 7.2.1 节 中 ， 将 会 再 次 考虑 双 正 交 性 。 
在 推导 子 带 编码 及 7.4 节 的 快速 小 波 变 换 时 ， 特 别 重要 的 是 滤波 器 ,. 它 排 除了 双 正 交 性 并 要 求 
(g,(n),g)(+2m)) = 5(i- j)5(m), 1,7 ={0, 1} (7.1-13) 
上 式 定义 了 完美 重建 滤波 器 组 的 正 交 性 。 除 式 (7.1-13) 外 ， 可 以 证 明正 交 滤 波 器 满足 如 下 两 个 条 件 ; 
gi(n)=(-1)" go (Keven —1—n) 
hm)=g(Koa —1-n), i={0, 1} 
AP, Keven 的 下 标 用 于 指出 滤波 器 系数 的 值 必须 能 被 2 整除 〈 即 偶数 ) 。 如 式 (7.1-14) 指 出 的 那样 ， 


(7.1-14) 


D FPS fin) Al A=) I ABUE (4..54)= Sof oni ， 其 中 * 表 示 复 共 思 操作 。 如 果 fi(n) 和 (mn) 是 实 的 , MWA (4.5) = (6-4) 。 
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综合 滤波 器 通过 顺序 反 转 和 调制 与 8 建立 联系 。 另 外， 有 加 和 为 分 别 是 综合 滤波 器 go 和 gg 的 
顺序 反 转 形式 。 这 样 ， 正 交 滤 波 器 组 就 可 围绕 单一 滤波 器 的 冲 激 响 应 来 开发 ， 称 之 为 原型 ; 其 
余 滤 波 器 可 以 通过 指定 原型 的 冲 激 响 应 来 计算 。 双 正 交 滤 波 器 组 要 求 有 两 个 原型 ， 其 余 滤波 器 
可 通过 式 (7.1-10) 和 式 (7.1-11) 来 计算 。 有 用 原型 滤波 器 的 产生 ， 无 论 是 归 一 化 正 交 的 还 是 双 正 
交 的 ， 都 超出 了 本 章 的 讨论 范围 。 这 里 我 们 只 是 简单 地 使 用 文献 中 已 有 的 滤波 器 ， 为 深入 学 习 
提供 参考 。 

在 使 用 二 维 子 带 编码 的 例子 来 总 结 本 节 之 前 ， 我 们 注意 到 一 维 正 交 和 双 正 交 滤 波 器 对 于 图 像 处 理 
来 说 ， 可 用 于 二 维 可 分 的 滤波 器 。 就 像 我 们 在 图 7.7 中 看 到 的 那样 ， 可 分 滤波 器 用 2.6.7 节 中 介绍 的 方 
法 ,首先 用 于 一 个 维度 ( 即 垂直 方向 ) ， 然 后 用 于 另 一 个 维度 ( 即 水 平方 向 ) 。 此 外 ， 在 两 个 阶段 都 执行 
下 采样 (一 次 是 在 第 二 次 滤波 操作 之 前 执行 )， 以 全 面 减少 计算 量 。 所 得 滤波 后 的 输出 ， 即 图 7.7 中 表 
IRJ a(m,n),d" (m,n),d" (m,n) ld? (m,n) , 分 别称 为 输入 图 像 的 近似 子 带 、 垂 直 细 节 子 带 、 水 平 细节 
子 带 和 对 角 线 细节 子 带 。 这 些 子 带 可 分 为 4 个 更 小 的 子 带 ， 更 小 的 子 带 还 可 再 分 ， 等 等 。 这 种 特性 将 
在 7.4 节 更 详细 描述 。 


a(m,n) 






d (m,n) 


f(mn) 


ne on ee ra os 
是 双 正 交 的 【 满足 式 (7.1-12) ] 和 归 一 化 正 交 的 [满足 

式 (7.1-13) ] 相对 比较 容易 。 因此 , 图 7.8 中 的 aim ai 
抽 头 小 让 各 支持 分 解 给 人 的 无 误 关 重建 。 a 
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下 采样 造成 的 。 不 管 是 否 混淆 ， 原 始 图 像 都 可 以 由 图 7.9 的 子 带 无 误差 地 重建 。 isle nia 
&iC 由 表 7.1 和 式 (7.1-14) 决 定 ， 并 且 合并 成 了 一 个 滤波 器 组 ， eax ps 

臻 反映 图 7.7 的 系统 。 在 新 滤波 器 组 中 ， REAC), i= (0, DEEM ae 
g(n) 副本 取代 ， 并 加 上 了 到 样 器 和 求 和 器 。 





ab h(n) h(n) 
cd | 1 
0.5 0.5 
0 0 
一 0.5 +05 
一 n —1 n 
0 2 4 6 8 0 2 4 6 8 
Ry (n) 81(n) 
1 1 
0.5 0.5 
0 0 
—0.5 一 0.5 
Si n =f n 
0 2 4 6 8 0 2 4 6 8 
图 7.8 


4 个 8 抽 头 Daubechies 归 一 化 正 交 滤波 器 的 冲 激 响 应 。 go(n) ,0 <n <7 的 值 见 表 7.1 





图 7.9 使 用 图 7.7 所 示 的 子 带 编码 系统 对 图 7.1 中 的 花瓶 进行 4 子 带 分 离 。 得 到 的 4 个 子 
带 分 别 是 ，(a) 近似 子 带 ; (b) 水 平 细 节 子 带 ; (CO 垂直 细节 子 带 ; @ 对 角 线 细节 子 带 


7.1.3 RRA 


第 三 个 也 是 最 后 一 个 与 多 分 辨 率 分 析 紧 密 联系 的 图 像 操 作 是 哈 尔 变换 (Haar[1910]) 。 在 本 章 的 内 容 
中 ， 哈 尔 变换 的 重要 性 体现 在 其 基 函 数 (在 下 面 定义 ) 是 已 知 的 最 古老 、 也 最 简单 的 正 交 小 波 。 它 们 将 
在 本 节 下 面 的 很 多 实例 中 得 到 应 用 。 

以 2.6.7 节 的 讨论 作为 参考 ， 哈 尔 变 换 可 用 如 下 矩阵 形式 表示 : 


T = HFH" (7.1-15) 


式 中 , 下 是 一 个 Wx N 图 像 矩阵 , HS Nx N 哈 尔 变换 矩阵 ,7T 是 一 个 Yx N 变换 结果 。 转 置 是 必 
要 的 , 因为 及 不 对 称 ; 在 2.6.7 节 的 式 (2.6-38) 中 ， 变 换 矩 阵 假定 是 对 称 的 。 对 于 哈 尔 变换 ， 瑟 包含 哈 


iB 
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RSE PRN, (z) ， 它 们 定义 在 连续 闭 区 间 ze[0.], 大 = 0,1,2,--,N-1E, HPN =2", BAER H, 
需要 定义 整数 k, Bk =2? +q-1, HPO <p<n-1, 当 p=0 时 , g=0 或 1, M4 p4OM, 1<q <2’. 
因此 ， 哈 尔 基 函数 为 


hy (Z) = Mg (z) = = Tp ze[0, 1] (7.1-16) 
和 
QP?) (q—1)/2? <z<(q—-0.5)/2? 
1 
hy, (2) = hy, (z) =—=4-2"", — (q—-0.5)/2? <z<q/2? (7.1-17) 
VN 0, 其 他 , ze [0, 1] 


Nx N 哈 尔 变 换 矩 阵 的 第 i 行 包含 了 元 素 hie), HP z=0/N, 1/N, 2/N,---,(N-1/N. PHN, WR N=2, 
那么 2x2 哈 尔 矩 阵 的 第 一 行使 用 ho(z), z= 0/2, 1/2 来 计算 。 由 式 (7.1-16) hy(z)=1/V2 ， 它 与 z 无 关 ， 
因此 到 有 两 个 相等 的 1/V2 元 素 。 第 二 行 由 计算 hE), z= 0/2, 1/2 得 到 。 因 为 当 k=1,p=0 且 4=1 时 
有 k=2+g-1, 因此 由 式 (7.1-17) 有 加 (0)=2°/V2=1/Y2 , (1/2) =-2°/ V2 =-1/V2 , 所 以 2x2 险 尔 
和 矩阵 是 


fi t 
m=z, d (7.1-18) 
WER N=4, HIBRI k, q F p 的 值 如 下 : 


N= Ole 
é ey 
Nee obs 


那么 4x4 AERA Hy 为 
1 wo 
Piet Fee er 
H=- e NS (7.1-19) 
oF E EY 


我 们 对 哈 尔 变换 的 主要 兴趣 在 于 , M TATELA 2 抽 头 完美 重建 滤波 器 组 ( 见 前 一 节 ) 的 分 析 
滤波 器 和 (za) 和 有 h(n) ， 以 及 最 简单 且 最 古老 的 小 波 变 换 ( 见 7.4 节 中 的 例 7.10) 的 缩放 比例 和 小 波 向 量 
(分 别 在 7.2.2 WA 7.2.3 节 中 定义 ) 。 与 其 用 计算 哈 尔 变换 来 结束 本 节 ， 不 如 用 一 个 例子 来 说 明 分 解 方 
法 的 影响 ， 剩 余 章节 将 要 描述 的 方法 中 已 经 考虑 到 这 一 点 。 


例 7.3 ”离散 小 波 变换 中 的 哈 尔 函 数 。 人 Eo 
”图 7.10(a) 显示 了 图 7.1 中 的 512x512 rege 分 解 ， 它 结合 了 金字 塔 编 和 尔 变换 (到 目 

MIERNE TAZARA 的 关键 性 质 tuhy fees 
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图 7.10 (a) FA 瑟 哈 尔 基 函数 的 离散 小 波 变换 ， 并 显示 了 其 局 部 直方 图 的 变化 ; 
(b)~(d) 由 (a) 得 到 的 几 种 不 同 的 近似 (64 x 64, 128 x 128 和 256 x 256) 


. 采用 类 似 于 使 用 图 7.3 (b) 中 的 预测 残 差 金字 塔 的 各 个 级 别 来 创建 不 同 分 辨 率 近似 图 像 的 方法 ， 
图 7. 10(a) 的 子 图 像 可 用 来 构建 图 7 1 中 原始 花瓶 图 像 的 粗 / 细 分 辩 率 近似 。 图 7.10 C) 到 (qd) 中 大 
小 分 别 为 64x 64, 128x 128 和 256x 256 的 图 像 是 由 图 7.10 (a) 中 的 子 图 像 生 成 的 。 因此 有 可 能 完美 
重建 512x512 的 原始 图 像 。 

.类 似 于 图 7.9 中 的 子 带 编码 分 解 ， 使 用 图 7.7 中 给 出 的 实 系数 FIR 滤波 器 组 产生 图 7.10(a) 。 类 似 
于 图 7.9 的 一 幅 4 子 带 图 像 生成 后 ，256 x 256 的 近似 子 带 被 分 解 并 被 4 个 128 x 128 的 子 带 代替 (使 
用 相同 的 滤波 器 组 ) ， 得 到 的 近似 子 带 被 再 次 分 解 并 被 4 个 64 x 64 的 子 带 代替 。 这 一 处 理 产 生 了 
唯一 的 子 图 像 排列 ， 并 表征 了 离散 小 波 变换 的 特性 。 正 如 我 们 从 图 像 的 右 下 角 移 到 左上 角 那 样 ， 
7.10(a) 的 子 图 像 尺寸 未 渐变 小 。 

.图 7.10(a) 不 是 图 7.1 中 图 像 的 哈 尔 变 换 。 尽 管用 于 产生 这 种 分 解 的 滤波 器 组 系数 取 自 哈 尔 变换 矩 
阵 夸 ,但 多 种 归 一 化 正 交 和 双 正 交 滤 波 器 组 系数 可 在 离散 小 波 变换 中 使 用 。 

.如 74 节 中 将 说 明 的 那样 ， 图 7.10(a) 中 的 每 幅 子 图 像 都 描绘 了 原始 图 像 中 空间 频率 的 一 个 特定 频 
HE, 另外 ， 许 多 子 图 像 显 示 了 方向 敏感 性 [例如 ,图 7.10(a) 右上 和 角 的 子 图 像 获取 原 图 像 中 的 水 平 
边缘 信息 ] 。 


SENAR 图 7.10 (a) 的 离散 小 波 变换 可 用 共 4 个 滤波 器 系数 的 2 HHS CHEK 
器 来 产生 。 
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7.2 多 分 辩 率 展开 


前 一 节 介 绍 了 三 种 著名 的 图 像 处 理 技 术 ， 它们 在 数学 理论 多 分 辨 率 分 析 (MRA) 中 扮演 了 重要 角 
色 。 在 MRA 中, 尺度 函数 被 用 于 建立 一 个 函数 或 一 幅 图 像 的 一 系列 近似 , 每 个 近似 与 其 最 近邻 近似 在 
分 辨 率 方面 都 用 基 2 来 区 分 。 然 后 ， 使 用 称 为 小 波 的 附加 函数 来 对 相 邻 近似 之 间 的 差 进行 编码 。 

7.2.1 级 数 展开 

信号 或 函数 f(x) 通常 能 分 解 为 一 系列 展开 函数 的 线性 组 合 : 

f(x) =): a, 9, (x) (7.2-1) 
k 

式 中 , 上 是 有 限 和 或 无 限 和 的 整数 下 标 ，w 是 具有 实数 值 的 展开 系数 ，piko 是 具有 实数 值 的 展开 函数 。 
如 果 展 开 是 唯一 的 ， 即 对 于 任何 给 定 的 c 只 有 一 组 ox 与 之 对 应 , 那么 ox) RAK BHR, 并 且 展 开 集 


合 {px()} 就 称 为 可 这 样 表示 的 一 类 函数 的 基 。 可 展开 的 函数 形成 了 一 个 函数 空间 ， 称 为 展开 集合 的 闭 
合 跨 度 ， 表 示 为 


V =Span{p,(x)} (7.2-2) 
k 
S eV 48 f ORF ONARE, HEA (7.2-1) 的 形式 。 
对 于 任意 函数 空间 V RAAT O WARA (0, (x)} 的 对 偶 函 数 集合 ， 它 可 


用 于 对 任意 f(x)eV 计 算式 (7.2-1) 的 系数 om.。 这 些 系数 是 通过 计算 对 侦 函 数 (x) 和 函数 f(x) 的 内 积 ” 
得 到 的 ， 即 


a, =(P) f(a) = [BY (dx (72:3) 


AP, ERRIRE. 依靠 展 开 集合 的 正 交 性 ,该 计算 假定 是 三 种 可 能 形式 中 的 一 种 。 本 章 末尾 的 
习题 7.10 用 二 维 欧 氏 空间 中 的 向 量 说 明了 这 三 种 情况 。 


情况 1:; 如 果 展 开 函数 构成 了 广 的 一 个 正 交 基 ， 即 


(9/09,0.00)=67 -人 oo (12-4) 
则 该 基 与 它 的 对 偶 基 相 等 ， 即 p,(x) = B(x) ， 式 (7.2-3) 变 成 
a, = (9 (x), f(x)) meres E 
以 由 基 函 数 与 /9 的 内 积 来 计算 。 
情况 2， 如 果 展开 函数 本 身 不 正 交 ， 但 却 是 及 的 一 个 正 交 基 ， 那 么 
(9,(2),9(x))=0, jzk (7.2-6) 


AER BOE PARLE SSK. HH (7.2-3) RH wk， 双 正 交 基 及 其 对 偶 有 下 列 形式 : 


D 两 个 实 或 复 值 函数 f(x) 和 g(x) 的 内 积 是 (f(x),g(x)) =| f (x)g(x)dx 。 如 果 f(x) 是 实 的 , 则 了 (x)= 了 (x) 且 (7(x),g(x))= 
[Ad 。 
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0, jzk 
(9;(x),(x)) = 6 = i 3 a (7.2-7) 


情况 3， 如 果 展 开 集 合 不 是 天 的 一 个 基 ， 但 支持 式 (72-1) 中 定义 的 展开 ， 那 么 它 就 是 一 个 跨度 集 
A, 在 该 跨度 集合 中 ,任何 /tbe 太 都 有 一 个 以 上 办 的 集合 。 展 开 函 数 及 其 对 偶 可 以 说 是 超 完备 
的 或 元 余 的 。 它 们 形成 了 一 个 框 课 ， 其 中 ， 对 于 某 些 4> 0, B<o RMA S@eV, A” 


ALF <> Ko. to <B| Feo (7.2-8) 
k 


用 f(x) 的 范 数 的 平方 去 除 该 式 ， 我 们 看 到 4 和 如 构成 了 扩展 系数 与 该 函数 的 归 一 化 内 积 。 类 似 式 
(7.2-3) 和 式 (7.2-5) 的 等 式 可 用 于 得 到 框架 的 展开 系数 。 若 4 = B， 则 展开 集合 称 为 紧 框 架 ， 并 且 
可 以 证 明 (Daubechies[1992]) 


/90-7420 (x), 0)) p00) (12-9) 


除雪 项 之 外 , 它 是 框架 元 余 的 度量 , 这 与 将 式 (7.2-5) (对 于 正 交 基 ) 代 入 式 (7.2-1) 得 到 的 表达 式 相等 。 
7.2.2 ”尺度 函数 


考虑 由 整数 平移 和 实数 二 值 尺度 、 平 方 可 积 函 数 g(x) 组 成 的 展开 函数 集合 ， 即 集合 {9,, (x)} ， 

其 中 
Pj x(x) = 2! 9(2 x-k) (7.2-10) 

对 所 有 的 j,keZ 和 g(x)eL(R) 都 成 立 ”。 这 里 , 大 决定 了 wjx(Co 沿 x 轴 的 位 置 ,7 决定 了 wjxCo 的 宽度 ， 
即 它 沿 x 轴 是 宽 还 是 罕 。 项 2° 控制 函数 的 幅度 。 由 于 o) 的 形状 随 j 发 生变 化 ,， 所 以 p(x) 称 为 尺度 
函数 。 适 当选 择 g(x)， 可 使 {gj; (x)} 跨越 世 (R)， 其 中 后 者 是 所 有 可 度量 的 、 平 方 可 积 函 数 的 集合 。 

车 将 式 (7.2-10) 中 的 7 限制 为 某 个 指定 值 , 如 j= 如, 则 得 到 的 展开 集合 {gjox(x} 是 {9jx (x)} 的 一 个 
子 集 ,， 它 跨越 己 (R) 的 子 空间 。 使 用 前 一 节 中 的 符号 ,我 们 可 将 该 子 空间 定义 为 


Vo= Span{ jo, (x)} (7.2-11) 
k 
即 Vo 是 gjox(x) 在 k 上 的 一 个 跨度 。f(x)eVio 时 , 我们 可 写 出 
S=] apo) (7.2-12) 
k 


更 一 般 地 ， 对 于 任何 j, 我 们 将 上 跨越 的 子 空间 表示 为 
V, =Span{g,,(x)} (7.2-13) 
k 


如 下 例 所 示 ， 增 加 了 就 会 增加 VAC), BENT PCRS Te) ee RA AE AAE E EA A A 
节 函 数 ， 原 因 如 下 : 随 着 j 的 增 大 ， 用 于 表示 子 空间 函数 的 gj.(x) 会 变 得 较 窗 ， 且 x 有 较 小 变化 
就 可 分 开 。 


DERA A| 的 SO 的 范 数 定义 为 (x) 与 自身 内 积 的 疙 对 值 的 平方 根 。 
O HESL P, REINIE, 表示 可 度量 的 、 平 方 可 积 的 一 维 函数 集合 ，Z 是 整数 集 。 


ab oo) =e) 
ed. 


ro 
1 


w 


0 1 2 
pi ol) = V2 ¢(2x) 
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pie) = p(x—l) 


= 9 
= ws 
Oo t j 
i 
cad 


0 1 2 
PLI(X) = V2 p(2x A 
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在 上 例 中 ， 简 单 尺度 函数 满足 多 分 辩 率 分 析 的 4 个 基本 要 求 (Mallat[1989a]) : 


MRA 要 求 1: 尺度 函数 对 其 整数 平移 是 正 交 的 。 

很 容易 看 出 ， 在 哈 尔 函 数 的 情况 下 ， 无 论 什 么 时 候 ， 只 要 尺度 函数 的 值 是 1， 其 整数 平移 就 是 0， 
所 以 二 者 的 乘积 为 0。 哈 尔 尺 度 函 数 是 紧 支 撑 的 ， 即 除了 称 为 支撑 区 的 有 限 区 间 外 ， 函 数值 都 为 
0。 事 实 上 ， 支 撑 的 宽度 是 1; 半 开 区 间 [0, 1) 外 其 值 为 0。 注意， 尺度 函数 的 支撑 宽度 大 于 1 时 ， 
正 交 整数 平移 的 要 求 将 很 难 满足 。 

MRA 22% 2: 低 尺 度 的 尺度 函数 跨越 的 子 空 间 ， 骨 套 在 高 尺度 跨越 的 子 空间 内 。 

如 图 7.12 所 示 ， 包 含 高 分 辩 率 函数 的 子 空间 必须 同时 包含 所 有 的 低 分 辩 率 函数 。 也 就 是 说 ， 


VHWc«-chV aVeoeReheceV,— (72-15) Yo V V2 
此 外 ， 这 些 子 空间 还 满足 直观 条 件 ， 即 如 果 /oj 万， / 
WBA fOxeV;. 1. 哈 尔 尺度 函数 满足 该 要 求 的 事实 ,并 不 意 


味 着 任何 支撑 宽度 为 1 的 函数 都 自动 满足 该 条 件 。 作 为 练 


习 ， 请 读者 证 明 同 样 简单 的 函数 Ç> 
els k 0.25 <x<0.75 
0, 其 他 
不 是 用 于 多 分 辩 率 分 析 的 一 个 有 效 尺度 函数 (见习 题 7.11) 。 


MRA 325% 3: 唯一 对 所 有 万 通 用 的 函数 是 六 9 = 0。 7.12 尺度 函数 跨越 的 嵌 套 函数 空间 
若 考 虑 可 能 最 粗糙 的 展开 函数 ( 即 j =- w) ， 则 唯一 的 表达 函数 就 是 没有 信息 的 函数 ， 即 


V» ={0} (7.2-16) 


MRA EK 4: 任何 函数 都 可 以 按 任意 精度 表示 。 虽 然 不 可 能 以 任意 粗糙 的 分 辨 率 来 展开 一 个 特定 的 
fO, HAE. (e) 所 示 函 数 的 情况 , 但 所 有 可 度量 的 、 平 方 可 积 的 函数 都 可 以 由 尺度 函数 在 产 -mm 的 
限制 下 表示 ， 即 


r={L(R)) : (7.2-17) 
在 这 些 条 件 下 ， 子 空间 万 的 展开 函数 可 以 表述 为 子 空间 Vi. RR, ASK (7.2-12) , & 
Pj x)= 之 “pn on (X) 


式 中 ， 为 清楚 起 见 ， 求 和 的 下 标 改 写成 了 n。 将 来 自 式 (7.2-10) 的 gj ARAL, 并 将 变量 a 改写 
成 h(n)， 上 式 变 成 


Pin (X)= Y h (2 (2/1 x—n) 
因为 g(x)= poo), 三 和 大 都 可 以 置 为 0， 以 得 到 较 简 单 的 无 下 标 表达 式 
9(x) = °h,(n)V29(2x-n) (7.2-18) 


该 递归 等 式 中 的 系数 ho(n) 称 为 尺度 函数 系数 ; hy 为 尺度 向 量 。 式 (7.2-18) 是 多 分 辨 率 分 析 的 基础 ， 称 
为 改进 等 式 、MRA 等 式 或 扩张 等 式 。 它 表明 任意 子 空间 的 展开 函数 , 都 可 以 由 其 本 身 的 双 倍 分 辨 率 副 民 
本 建立 ， 即 来 自 相 邻 较 高 分 辩 率 空间 的 展开 函数 。 参 考 子 空间 功 的 选择 是 任意 的 。 


加 
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7.2.3 RAŽ V= Ve WW WoW 


给 定 满足 前 一 节 中 MRA 要 求 的 尺度 函数 ， 我 
们 可 以 定义 小 波 函数 y(x)， 它 与 其 整数 平移 及 二 值 
尺度 一 起 ， 跨 越 了 任意 两 个 相 邻 尺度 子 空间 V 和 
,之 间 的 差 。 图 7.13 图 示 说 明了 这 种 情况 。 对 于 
跨越 图 中 W, 空间 的 所 有 keZ， 我 们 定义 小 波 集合 
fw} , 
V a(x) =2 y(2/x-k) (7.2-19) 
使 用 尺度 函数 ， 可 以 写 出 


Vi=V® Wo 





图 7.13 尺度 函数 与 小 波 函 数 空间 之 间 的 关系 


W, =Span{y,,(x)} (7.2-20) 
k 
并 注意 到 如 果 /(x)e 所 ， 那么 有 
f= Vay). ber (7.2-21) 
k à 


7.13 中 的 尺度 函数 和 小 波 函 数 子 空间 由 下 式 联系 起 来 : 
Vy =V, OW, (7.2-22) 


jH 


AF, © 表示 空间 的 并 集 ( 类 似 于 集合 的 并 集 ) o Va 中 万 的 正 交 补 集 是 W, AV Pramas W, 
中 的 所 有 成 员 都 正 交 。 因 此 ， 


(ojxC9g,wjrCoD)=0 (7.2-23) 
对 所 有 适当 的 jh leZ 都 成 立 。 
现在 我 们 可 以 将 所 有 可 度量 的 、 平 方 可 积 的 函数 空间 表示 为 
LP (R)=V, OW, OW, D- (7.2-24) 
或 
LP (R)=V, OW, OW, O. (7.2-25) 
甚至 是 
L(R)=:…@W, OW, OW, OW, OW, @--- (7.2-26) 


KA 上 式 中 消除 了 尺度 函数 ， 并 且 函 数 仅 用 小 波 项 来 表示 [ 即 在 式 (7.2-26) 中 仅 有 小 波 函 数 空间 ]。 注意， 
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if 09 是 Vi TIE 矶 的 元 素 ， 则 使 用 式 (7.2-24) 的 展开 包含 使 用 万 尺 度 函 数 的 fw) 的 近似 ; 来 自 两 的 
小 波 将 对 这 种 近似 与 实际 函数 之 间 的 差 进行 编码 。 由 式 (7.2-24) 到 式 (7.2-26) ， 可 推广 得 到 
D(R)=V, OW, OW, , ®- (7.2-27) 
式 中 , 力 是 任意 开始 尺度 。 
因为 小 波 空间 存在 于 由 相 邻 较 高 分 辩 率 尺 度 函数 跨越 的 空间 中 ( 见 图 7.13) ， 所 以 任何 小 波 函数 ， 


类 似 式 (7.2-18) 中 其 尺度 函数 的 对 应 部 分 ， 可 以 表示 成 平移 后 的 双 倍 分 辨 率 尺度 函数 的 加 权 和 。 也 就 
是 说 ,可 以 写成 


W(x) = m2 (2x—n) ` (7.2-28) 
式 中 ,h(n) 称 为 小 KARAK, 有 为 小 波 向 量 。 利 用 图 7.13 eee eer 
”是 正 交 的 条 件 ， 可 以 证 明 h(n) 和 h(n) 按 下 述 方式 相关 (例如 ， 见 Burrus, Gopinath and Guo[1998]) : 
h,(n)=(-D)"h, (l-n) (7.2-29) 
注意 该 结果 与 式 (7.1-14) 的 相似 性 ， 这 一 关系 决定 了 正 交 子 带 编码 和 解码 滤波 器 的 冲 激 响应 。 
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Wx) = pool) Woz(x) = W(x — 2) ab 
cd 
1 1 et 
0 0 
T i 
* = 
0 1 2 3 0 1 2 3 
hi olx) = V2 y(2x) f(x) e Vi = Vo 8 Wo 
I 1 
0 0 — 
| | 
Ai =] 
| | 
x Bs 
0 1 2 3 0 1 2 3 
fax) E Vo falx) E Wo 
1 1 
0 0 
=] =] 
x x 
0 1 2 xi 0 1 2 3 


图 7.14 两 和 两 中 的 哈 尔 小 波 函 数 
7.3 一 维 小 波 变 换 


现在 我 们 可 以 正式 地 定义 几 个 紧密 相关 的 小 波 变换 : 一 般 的 小 波 级 数 展开 、 离 散 小 波 变 换 和 连续 
小 波 变 换 。 它 们 在 傅 里 叶 域 中 的 对 应 形式 分 别 是 传 里 叶 级 数 展 开 、 离 散 传 里 叶 变 换 和 积分 传 里 叶 变换 。 
7.4 节 将 说 明 一 种 计算 效率 很 高 的 称 为 快速 小 波 变换 的 离散 小 波 变换 。 


7.3.1 小 波 级 数 展 开 


首先 定义 与 小 波 y(x) 和 尺度 函数 p(X) 相关 的 函数 f(x)eZX(R) 的 小 波 级 数 展开 ,根据 式 (7.2-27) ,f(x) 
可 表示 为 子 空间 Vo “PARE PROFIT 式 (7.2-12) 定 义 了 这 样 一 个 展开 ) 和 子 空间 Wo, Woo, PRHE 
些小 波 函数 [就 像 式 (7.2-21) 中 定义 的 那样 ]， 即 


=F copo + > Yd Oyu (7.3-1) 
k j=i k 

其 中 , jo ERRARE, OR di( 局 分别 是 式 (7.2-12) 和 式 (7.2-21) 中 中 的 改写 形式 。cno( 昌 通 

常 称 为 近似 和 /或 尺度 系数 ，d( 朋 称 为 细节 和 /或 小 波 系数 。 这 是 因为 式 (7.3-1) 中 的 第 一 个 和 式 使 用 
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尺度 函数 提供 了 (x) 在 尺度 加 处 的 近似 [除非 fe Vo 使 得 尺度 函数 的 和 等 于 f(x) ]。 对 于 第 二 个 和 
式 中 的 每 个 较 高 尺度 j 加， 近似 中 添加 了 更 细 分 辩 率 的 函数 一 一 即 小 波 的 和 ， 以 便 增加 细节 。 如 果 
展开 函数 形成 了 一 个 正 交 基 或 紧 框 架 ( 通常 情况 下 如 此 ), 那么 基于 式 (7.2-5) 和 式 (7.2-9) 的 展开 系数 


计算 如 下 : 因为 /是 实 函数 ， 故 式 (73-2) 和 式 
pik) ( SPor x)) = | SOW jox dx (7.3-2) (7.3-3) HARPER ie ESE 


和 


d O=O, wa) =| fwa Cr (7.3-3) 


在 式 (72-5) 和 式 (7.2-9) 中 ， 展 开 系数 ( 即 @ ) 定 义 为 展开 函数 和 用 于 展开 的 函数 的 内 积 。 在 式 (7.3-2) 
和 (7.3-3) 中， 展开 函数 是 gjo 和 yix ， 展 开 系数 是 cn Md, 。 如 果 展 开 函 数 是 双 正 交 基 的 一 部 分 ， 那 
么 这 些 等 式 中 的 gp 项 和 w 项 必须 用 它们 的 对 偶 函 数 太 和 放 代 蔡 。 





308 数字 图 像 处 理 (第 三 版 ) 








图 7.15 使 用 哈 尔 小 波 y= 尼 的 小 波 级 数 展开 
7.3.2 ”离散 小 波 变 换 


与 傅 里 叶 级 数 展开 相似 ， 前 一 节 的 小 波 级 数 展开 将 一 个 连续 变量 函数 映射 为 一 系列 系数 。 如 果 
待 展开 的 函数 是 离散 的 ( 即 数字 序列 ) ， 得 到 的 系数 就 称 之 为 离散 小 波 变换 (DWT) 。 例 如 ， 对 于 某 些 
xo, Ax 和 n=0,1,2,…, M1, 若 f(n)=f(xo+nAx), 对 fw) 的 小 波 级 数 展开 系数 [由 式 (7.3-2) 和 式 (7.3-3) 
定义 ] 就 变 成 序列 f(n) 的 正 向 DWT 系数 : 


Work) == > fp x(n) (73-5) 
JM + 


MOD- a. jh (73-6) 


在 这 些 等 式 中 ，Viok(Cz) My (n) IER Qo, (x) My, (x) 的 取样 形式 。 例 如 ， 对 于 某 些 x, Ar, 和 
n=0,1,2,…,M-1, Æ Pon) =Po + NAX,) o 这样, 我 们 就 在 基 活 数 的 支撑 上 使 用 MM 个 等 间隔 的 
取样 ( 见 下 面 的 例 7.8) 。 根 据 式 (7.1-3) ， 反 向 DWT 是 


f(n)= ee W, (os hp a(n) ie AIO (73-7) 
k J=h k 


通常 , RS jo =0, HEMA 2 WORE (BN M=2’), ER (7.3-5) ER (7.3-7) F, RAE n=0, 1, 2,…， 
M-1,j=0, 1,2,---,J—1 F k=0,1, 2,---,2/-1 上 执行 。 对 于 哈 尔 小 波 ， 变 换 中 采用 的 离散 尺度 和 小 波 
pa (BYE PRO 与 7.1.3 节 中 的 Mx M 哈 尔 变 换 矩 阵 的 行 相对 应 。 变 换 本 身 由 M 个 系数 组 成 ， 最 小 斥 
度 是 0， 最 大 尺度 是 .一 1。 出 于 对 7.3.1 节 的 注释 和 例 7.6 中 说 明 的 原因 ， 式 (7.3-5) 和 式 (7.3-6) 中 定义 
的 系数 通常 分 别称 为 近似 系数 和 细节 系数 。 
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ZK (7.3-5) 到 式 (7.3-7) PHY 所 ,Qjo, 月 和 现 ( 记 月 ， 分 别 对 应 于 前 一 节 中 的 小 波 级 数 展开 co( 间 和 dk) 
(这 些 变量 的 改变 并 不 是 必需 的 ， 但 为 下 一 节 的 连续 小 波 变换 中 的 标准 表示 提供 了 铺垫 ) 。 注 意 ， 级 数 
展开 中 的 积分 已 用 求 和 代替 ， 而 曾 在 4.4.1 节 的 DFT 中 出 现 的 归 一 化 因子 1/VM 已 加 到 了 正 向 和 反 向 
展开 表达 式 中 。 该 因子 也 可 以 在 正 向 展开 和 反 向 展开 表达 式 中 以 1/M 的 形式 出 现 。 最 后 ,应 记 住 式 (7.3-5) 
到 式 (7.3-7) 只 对 正 交 基 和 紧 框 架 有 效 。 对 于 双 正 交 基 , IN (7.3-5) 和 式 (7.3-6) 中 的 g FI y 项 必须 分 别 由 
它们 的 对 偶 函 数 5 M y RRE. 


例 7.8 计算 一 维 离散 小 波 变换 。 

为 说 明 式 (7.3-5) 到 式 (7.3-7) 的 使 用 ， 考 虑 4 Pe £0) =1,f0)=4, fQ)=—-3 MLB) =0. Al 
AM=4, J=2, HF jy=0, 和 y=0 时 k=0, j=1 Rf k=0,17Ex=0,1,2,3, f=0,1 工 执行 来 和 5 我 
们 将 使 用 喻 尔 尺度 函数 和 小 波 函 数 ， 并 假定 了 (x) 的 4 MARANA ERE PRR SCHED Ly BERAREN 1。 
将 4 个 样本 代入 式 (7.3-5) ， 我 们 得 到 





WG, 0-35 sme, ,= Traadid -1]=1 


HAREA = oE 2, 3 有 goo(m)=1。 注意 ， 这 里 采用 的 是 哈 尔 尺度 函数 对 于 j= Seine .0 的 均匀 间隔 采样 。 
这 些 值 对 应 于 7.1.3 节 的 哈 尔 变 换 和 矩阵 琴 的 第 一 行 。 继 续 使 用 式 (7.3-6) 和 相似 间隔 的 样本 wdx), EXTD 
F Ay WIG 2,3,447, 我 们 得 到 a 


W,(0, 0) = pecak ' 
w, a, =5[1-J2+4-(V2)-3-040-0] = SI 
mt = th. Pko Wee. CAD] SY 


因此 , 这 个 简单 4 点 样本 丽 数 的 离散 小 波 变换 HH ANU BERS RR 4,-1.5 2 ,-1.5 2 }, 
这 里 ， 变 换 系数 是 按 计算 顺序 排列 的 。 
式 (73-7) 可 使 我 们 由 其 变换 来 重建 原始 函数 。 重 复 求 和 ， 我 们 得 到 


1 0) = [WCO Opp, (0) +W, (0, Owe, o0) +W, 0, OW, on) +W, Dy 1)] 
n=0,1,2,3。 例如， Bald 0, WA che 
f(0)= tia 司 5V9-(2)—1.5<2 2-0|=1 
与 正 变换 情况 一 样 ， 尺度 函数 和 小 波 函 数 的 均匀 间隔 采样 也 用 于 反 变换 的 计算 。 


上 例 中 的 4 点 DWT 是 f (nm) 的 一 个 二 尺度 分 解 ， 即 j = {0, 1}. 基本 假设 是 开始 尺度 刀 为 0， 但 也 可 
以 使 用 其 他 的 开始 尺度 。 作 为 练习 (见习 题 7.16) ， 请 读者 在 开始 尺度 为 1 时 ， 计 算 单 尺度 变换 {2.5 V2 , 
-1.5 V2 ,—1.5 V2 , -1.5 V2 } 的 结果 。 这 样 ， 式 (7.3-5) 和 式 (7.3-6) 就 定义 了 “一 族 ” 开 始 尺 度 加 不 同 的 

7.3.3 连续 小 波 变 换 

离散 小 波 变换 的 自然 延伸 是 连续 小 波 变换 (CWT) , 连续 小 波 变换 将 一 个 连续 函数 变换 为 两 个 连续 





变量 (平移 和 尺度 ) 的 高 宛 余 度 函 数 。 变 换 结 果 在 时 间 - 频 率 分 析 时 很 容易 解释 并 有 很 大 的 价值 。 虽 然 我 PH 


们 的 兴趣 在 离散 图 像 上 ,但 出 于 完整 性 的 考虑 ， 这 里 也 覆盖 了 连续 变换 。 
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连续 平方 可 积 函数 0) 的 连续 小 波 变换 与 实数 值 小 波 wa 的 关系 定义 为 





W,(s, 7) = i fy, (dx (7.3-8) 
式 中 ， FT 
srCD = v(t z) (73-9) 
s 和 分 别称 为 尺度 参数 和 平移 参数 。 给 定 Ws, 0), TERE IAEA f(x): 
fo=> zi jih W, (s, j AAT (73-10) 
式 中 ， 
E Eat dy : (7.3-11) 


P) 是 wo 的 傅 里 时 变换 。 只 要 满足 所 谓 的 允许 条 件 Cy <m (Grossman and Morlet[1984])， 式 (7.3-8) 
到 式 (7.3-11) 就 定义 了 反 变 换 。 大 多 数 情况 下 ， AERE P(O = 0 ， 且 当 使 得 C, <w ，u 一 ww 时 以 足 
够 快 的 速度 使 (4) 一 0。 

“上 面 这 些 等 式 使 我 们 想起 了 它们 的 离散 形式 ， 即 式 (7.2-19) 、 式 (7.3-1) 、 式 (7.3-3) 、 式 (7.3-6) 和 
式 (7.3-7) 。 注 意 下 列 相 似 性 : 


1. 连续 变换 参数 + 取代 了 整数 平移 参数 ko 

2. 连续 尺度 参数 s 与 二 进 制 尺度 参数 相反 。 这 是 由 于 s 出 现在 式 (7.3-9) 中 yw((x*- r)/ s) 的 分 母 
上 。 这 样 ， 连 续 变换 中 使 用 的 小 波 在 0<s < 1 时 就 被 压缩 或 宽度 减 小 ， 在 s > 工时 就 被 扩大 或 
展开 。 小 波 尺度 和 传统 意义 上 的 频率 表示 关系 是 相反 的 。 

3. 连续 变换 类 似 于 级 数 展开 [ 见 式 (7.3-1) ] IARE j = -0 的 离散 变换 [ 见 式 (73-6) b R 
据 式 (7.2-26) ， 这 消除 了 明显 的 尺度 函数 间 的 联系 ， 因 此 函数 仅 用 小 波 项 来 表示 。, 

4. 与 离散 变换 类 似 , 连续 变换 可 视 为 一 组 变换 系数 {Wy(s, 2}, 它 度 量 /9 与 一 组 基 函 数 {ys :x)} 
的 相似 性 。 但 在 连续 情况 下 , 两 个 集合 都 是 无 穷 的 。 由 于 y :9 具有 实数 值 , AL ys :CD = ws 0), 
所 以 式 (7.3-8) 中 的 每 个 系数 都 是 AD0 和 ys ORAR O), ws, Ax) )。 
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图 7.16(b) 中 的 传 里 时 频谱 不 同 ， 它 同时 给 出 了 空间 域 和 频率 域 信息 。 注 意 ， 例 如 ， 当 s = 1 时 ， 变 换 在 r= 10 
时 达到 最 大 值 ， 这 对 应 于 了 C) 的 分 量 WoC9 的 位 置 。 因 为 变换 为 了 oo0 及 其 计算 出 的 小 波 之 间 的 相似 性 提供 
了 客观 评价 ， 因 此 很 容易 理解 它 是 如 何 用 于 特征 检测 的 。 我 们 仅 需 要 与 感 兴趣 的 特征 相 匹配 的 小 波 。 根 据 
图 7.16(d) 中 的 灰 度 图 也 可 以 得 出 类 似 的 结论 , 其 中 变换 的 绝对 值 |Wiy(s; 可 用 黑白 之 间 的 灰 度 来 显示 。 注意， 
连续 小 波 变 换 将 一 个 一 维 函数 变 成 一 个 三 维 结 采 

ab 


f(x) \F()| 
1 cd 




















0.4 X 
0 10 80 100 








100 





0 10 T 80 100 





图 7.16 连续 小 波 变换 [ (c) 和 (d) ] 和 一 个 连续 一 维 函 数 (a) KLEY (b 


7.4 快速 小 波 变换 


快速 小 波 变换 (FWT) 是 一 种 实现 离散 小 波 变 换 (DWT) 的 高 效 计算 ,该 变换 使 用 了 相 邻 尺度 DWT 


系数 间 的 一 种 幸运 且 令 人 惊讶 的 关系 。 它 也 称 为 Mallat 人 字形 算法 (Mallat{1989a, 1989b]) ，FWT 类 似 于 
7.12 节 中 的 2 子 带 的 子 带 编码 方案 。 | 式 04) 是 72 R 0218+ 
再 次 考虑 多 分 辩 率 的 详细 等 式 ei dam = = 
(x)= $ hy(nV29(2x =n) (7.4-1) 


用 2 对 x 尺度 化 ， 用 对 它 平移 ， 并 令 m=2k +n, Ath 
g(2! x- jea (n)\V29(2(2/ x-k)—n) is (n)V29(2/*!x—2k—n) 


Ly, (m—2k)V2(2!"'x- 
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注意 ， 尺 度 向 量 h 视 为 用 来 将 g(2x- 且 展开 为 尺度 j+1 的 尺度 函数 之 和 的 “加 权 ”。 从 式 (7.2-28) 开始 
的 一 系列 类 似 操作 为 y(2x- 甩 提供 了 一 个 相似 的 结论 ， 即 


y(2!x—k) = 9 h, (m—2k)V29(2!"!x-m) (7.4-3) 


其 中 , 式 (7.4-2) 中 的 尺度 向 量 h(n) 对 应 于 式 (7.4-3) 中 的 小 波 向 量 hm)。 [a a, NSE 
现在 考虑 7.3.1 节 中 的 式 (7.3-2) 和 式 (7.3-3) 。 它 们 定义 了 连续 函数 | 系数 变 成 了 DWT 系数 。 这 里 ,我们 


oo 的 小 波 级 数 展开 系数 。 将 小 波 定义 式 (7.2-19) 代 入 式 (7.3-3) ， 得 到 ”| 从 级 数 展开 系数 开始 ， 以 便 简化 推导 
过 程 ; 我 们 可 直接 代入 早期 的 结果 
d ,(k)= fs (x)2!? y(2 x- k)dx (7.4-4) | (如 尺度 和 小 波 函 数 的 定义 ) 。 


使 用 式 (7.4-3) 的 右 端 代替 y(2x- 有 D 后 ， 变 成 





qd,(k)= | f(x)2!”” Diem 一 aye! xm | (7.4-5) 
交换 求 和 与 积分 的 顺序 ， 并 重新 排列 各 项 ， 有 
d(k)= > hm- 2k)) f F2 ox- m)| (7.4-6) 
其 中 , 方 括 号 中 的 量 是 式 (7.3-2) 在 jn=j+1 和 k=m 时 的 cjo(k)。 为 了 理解 这 一 点 , 将 式 (7.2-10) 代 入 
式 (7.3-2) ， 并 分 别 用 jy+1 Alm RAF oM k 因此 ， 可 以 写 出 
d,(k) = Ža, (m—2k)c ,,,(m) (7.4-7) 
注意 ， 尺 度 j 的 细节 系数 是 尺度 j+1 的 近似 系数 的 函数 。 以 式 (7.4-2) 和 式 (7.3-2 作为 涉及 小 波 级 数 展 
开 ( 和 DWT) 近 似 系数 类 似 推导 的 起 点 ， 我 们 同样 发 现 
c;(k)= h, (m-2k)c;,(m) (7.4-8) 
当 ftx) 为 离散 函数 时 ( 见 7.3.2 节 ) ,因为 小 波 级 数 展开 的 系数 cj(k) Ad (k) ÆR T DWT HRW, (k) 
AW, (i,k), SAAT WAS H 


W,(j, k)= + (m—2k)W,(j +1, m) (7.4-9) 


Wi, k)= È hy (m—2k\W,(j +1, m) (7,4-10) 


ZK (7.4-9) 和 式 (7.4-10) 揭示 了 相 邻 尺度 的 DWT 系数 间 的 明显 关系 。 将 这 些 结果 与 式 (7.1-7) 进行 
比较 , RATEI W, (G, k) PW, (j,k) , RE 7 的 近似 和 细节 系数 可 用 所 (j+1,k) 和 尺度 /1 的 近似 系数 ， 
分 别 与 顺序 倒置 尺度 和 小 波 向 量 h(-n) 与 h(-n) 进行 卷 积 操作 ,然后 对 结果 下 取样 来 计算 。 图 7.17 
以 方 框图 的 形式 总 结 了 这 些 操作 。 注 意 ， 这 个 方 框图 与 图 7.6 中 的 2 带 度 子 带 编码 和 解码 系统 在 
h(n) = h, (n) Fil h (n) = h, (Cn) 时 的 分 析 部 分 相同 。 因 此 ， 可 以 写 出 


W,(j, k)=h,(—n)*W,(j +1, n) (7.4-11) 





n=2k, kz 0 


和 


Wj, k) =h, (—nykW, (j +1, n) (7.4-12) 





n=2k, k= 0 
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其 中 ， 卷 积 在 n=2kk 宇 0 时 直接 求 值 。 如 例 7.10 中 所 述 ， 非 负 偶数 项 求 卷 积 等 价 于 滤波 和 基 2 下 


取样 。 


WG, n) 






如 果 将 式 (74-9) 中 的 hh,(m 一 2k) 重 
写 为 h,(-(2k 一 m)) ,我 们 会 发 现 第 一 


个 减 号 负责 颠倒 | 顺序 [ 见 式 (7.1-6) ] ， 
2k 人 负责 子 取样 [ 见 式 (7.1-2) ] , m 是 卷 
积 的 哑 变 量 [ 见 式 (7.1-7) ] 。 





W.(j + 1,n) 





图 7.17 一 个 FWT 分 析 滤 波 器 组 


WC, n) 


3K (7.4-11) 和 式 (7.4-12) 是 计算 快速 小 波 变换 的 定义 式 。 对 于 长 度 为 M=2 的 序列 ， 所 涉及 的 数学 
运算 次 数 约 为 OQ0)， 即 乘法 和 加 法 的 次 数 与 输入 序列 的 长 度 呈 线性 关系 ， 因 为 在 图 7.17 中 , 用 FWT 
分 析 滤 波 器 组 执行 的 卷 积 所 涉及 的 乘法 和 加 法 的 次 数 ， 与 进行 卷 积 序列 的 长 度 成 正比 。 这 样 , 用 FWT 
就 比 用 FFT 算法 有 利 ， 它 约 要 求 OM log M) 次 操作 。 

为 总 结 FWT 的 论述 ， 我 们 注意 到 图 7.17 中 的 滤波 器 组 可 “迭代 ”地 产生 多 级 结构 ， 以 便 计算 两 
个 或 多 个 连续 尺度 的 DWT 系数 。 例 如 ， 图 7.18 (a) 显示 了 用 于 计算 变换 的 两 个 最 高 尺度 系数 的 二 级 滤 
波 器 组 。 注 意 ， 最 高 尺度 系数 假定 为 函数 本 身 的 取样 值 ， 即 FFU,(J, n) =f(n)， 其 中 了 表示 最 高 尺度 [根据 
7227, fixe 历 其 中 VERBAL /9 所 在 的 尺度 空间 上 图 7.18 (a) 中 的 第 一 个 滤波 器 组 将 原始 函数 分 
解 为 一 个 低 通 函数 [ 它 对 应 于 尺度 系数 W,(J-1, n) 的 近似 分 量 ] 和 一 个 高 通 函 数 [ 它 对 应 于 系数 W J-L, 
站 的 细节 分 量 l 这 就 是 图 7.18(b) 的 图 示 说 明 ,， 其 中 尺度 空间 廊 被 分 成 小 波 子 空间 Wa 和 尺度 子 空间 
Viio 原始 函数 的 频谱 被 分 成 两 个 半 带 宽 分 量 。 图 7.18 (a) 中 的 第 二 个 滤波 器 组 将 频谱 和 子 空间 Vy, BE 
低 的 半 带 宽 ， 分 解 成 /4 带宽 子 空间 Wyo 和 V2， 分 别 对 应 于 DWT 系数 W,(J-2, n) 和 W,(J-2, n). 










= W,(J — 1,1) 
Kn 
W,(J = 1,) 


vV — +! 





| 
| 
| 
l 
l 
l 
| 
1 
w 
T 


0 万 /4 ar /2 
图 7.18 (a) 一 个 二 级 或 二 尺度 FWT 分 析 滤波 器 组 ; (b) 其 频率 分 离 特性 
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图 7.18(a 中 的 二 级 滤波 器 组 很 容易 扩展 到 任意 尺度 。 例 如 ， 第 三 个 滤波 器 组 将 在 W,(J-2,n) 
系数 上 操作 ,将 尺度 空间 Vi 分 成 两 个 1/8 带宽 的 子 空间 到 3 和 V 通常 ,我 们 选择 /oo 的 和 个 样 
AS, 并 用 PP 个 滤波 器 组 (如 图 7.17 所 示 ) 在 尺度 三 1, -2,…,J-P 处 生成 一 个 P 尺 度 的 FWT。 首先 计 
算 最 高 尺度 ( 即 三 1) 的 系数 ， 最 后 计算 最 低 尺 度 ( 即 了 =- P) 的 系数 。 如 果 f (x) 以 高 于 奈 奎 斯 特 率 的 取 
样 率 取样 (通常 如 此 ), 那么 其 样本 是 该 取样 分 辩 率 下 的 尺度 系数 的 良好 近似 ， 并 可 以 作为 起 始 的 高 
分 辨 率 尺 度 系数 的 输入 。 换 名 话说， 在 该 取样 尺度 ， 不 需要 小 波 或 细节 系数 。 最 高 分 辨 率 的 尺度 函 
数 作为 式 (7.3-5) 和 式 (7.3-6) 中 的 单位 离散 冲 激 函 数 , 允许 f(n) 用 做 第 一 个 二 带宽 滤波 器 组 的 尺度 ( 近 
似 ) 输 入 (Odegard, Gopinath and Burrus[1992]) 。 


例 7.10 计算 一 维 快速 小 波 变换 。 
为 解释 前 面 的 概念 ， 考 虑 例 7.8 中 的 离散 函数 AD = 4,3, 0}o 如 例 1. 8 那样， 我 们 将 计算 基于 哈 
尔 尺度 和 小 波 函 数 的 变换 。 Go gf 8 中 的 DWT 那样 直接 使 用 基 函 数 ， 而 是 使 用 例 7 5 和 例 7.6 
中 的 相应 尺度 和 小 波 向 量 : 


mle a 起 ‘aay 
All 
(1/2, i Ka 
h, (n) = ee yl wiley Oh Me, (7.4-14) 
Tindi | 


这 些 是 用 于 建立 FWT 滤波 器 组 的 函数 ; 它们 提供 了 滤波 器 系数 。 注意 ， 因为 哈 尔 尺度 函数 和 小 波 函 数 是 
归 一 化 正 交 的 , 式 (7.1- 1 可 用 在 类 似 表 72 中 的 h(n) 单个 原型 滤波 器 ， = 
Æ FWT 滤波 器 系数 ， 它 对 应 于 式 (7.1-14) 中 的 gm。 o 

因为 例 7.8 中 计算 的 DWT HIER {W,(0, 0), W0, 0), W1, 0), W1, 1)} 4 
成 ， 我们 将 对 尺度 j= (0, 1} 计 算 相 应 的 二 尺度 FWT, 即 J=2( 有 2 = 个 样 
本 ) 且 已 =2( 按 尺度 .一 1=2-1=1 和 JJ-P=2-2=0 的 顺序 进行 ) 。 变 换 使 
用 图 7.18 (a) 中 的 二 级 滤波 器 组 进行 计算 -图 7.19 显示 了 由 所 要 求 的 FEWT 卷 积 
和 下 取样 操作 得 到 的 序列 。 注 意 ， 函数 /() 自 身 是 最 左 侧 滤波 器 组 的 尺度 (近似 ) 输 入 。 例如 ， 为 计算 出 现在 
图 7.19 中 上 支 路 末端 的 现 人 1, 朋 系数， 我 们 首先 要 做 7 和 态 人 由 的 卷 积 。 如 3.4.2 节 所 述 ， 这 要 求 关 于 原点 
翻转 其 中 的 一 个 函数 ， 并 滑 过 另 一 个 函数 ， 逐 点 计算 两 个 函数 各 对 应 点 的 乘积 之 和 。 对 于 序列 1, 4, -3, 0} 和 
{(-1/V2 ,1/J2}, 产生 的 结果 为 


{-1/V2, aa, ie 3 i, o) 


其 中 ,第 二 项 对 应 于 序号 X=2n=0( 在 图 7.19 中 ， 带 下 夯 线 的 值 表示 负 序号 ， En <0), 以 偶 序 号 点 下 取样 
时 , 我 们 得 到 WI, b= {-3/V2 ,-3/V2 },k= {0,1}. Bb, 我们 也 可 以 使 用 式 (74-12) 来 计算 : 


WL, K) = hy (mW, 2, nay ps o = hy (md * Fm) 


， 表 7.2 h(n) 的 正 交 归 一 
化 哈 尔 滤波 器 系数 





n=2k, k= 0 


= Dh, (l -2k)x(l) 
l 





axi 1 
=—=x(2k) -—=x(2k +1 
en Eo ) I +1) 


518 
这 里 ,我 们 用 2k 代替 卷 积 中 的 n， 并 采用 1 作为 卷 积 的 虚 变 量 ( 即 置 换 相关 的 两 个 序列 ) 。 展 开 的 和 中 只 有 





k=0, 1 
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k=0, BRAVE W, (0) =-3/V2 ; 对 于 k=1， 


2, ESHER Be, Hl 





{-1/V2, -3/V2, 7/2, -3/V2, 0} 





W,,(0, 0) = {4} 


W,(0, 0) = {1} 





{2.5,1, -1.5} 
图 7.19 ”使 用 哈 尔 尺度 和 小 波 向 量 计算 序列 {1, 4, -3, 0} 的 一 个 二 尺度 快速 小 波 变换 


如 可 能 期 望 的 那样 ， 从 正 变换 的 结果 重建 了 (n) 的 快速 反 变换 也 可 以 表达 出 来 。 这 称 为 快速 小 波 反 
变换 (EWT-) ， 它 使 用 正 变 换 中 采用 的 尺度 和 小 波 向 量 ， 以 及 第 j 级 的 近似 和 细节 系数 ， 来 生成 第 j+1 级 
的 近似 系数 , 注意 图 7.17 中 的 FWT 分 析 滤 波 器 组 和 图 7.6(a) 中 的 2 带宽 子 带 分 析 部 分 之 间 的 相似 性 ， 
我 们 可 以 立即 得 出 所 需 的 FWT 综合 滤波 器 组 。 图 7.20 详细 描述 了 它 的 结构 ， 该 结构 与 图 7.6(a) 中 
的 2 带宽 子 带 编码 和 解码 系统 的 综合 部 分 相同 。7.1.2 节 中 的 式 (7.1-14) 定义 了 相关 的 综合 滤波 器 。 
如 该 节 解 释 的 那样 ,完美 重建 (对 于 二 子 带 正 交 滤波 器 ) 要 求 对 于 i= {0, 1} 有 gi(n) =h(-n)。 也 就 是 说 ， 
综合 滤波 器 和 分 析 滤波 器 彼此 之 间 必 须 是 顺序 相反 
的 形式 。 因 为 FWT 分 析 滤 波 器 ( 见 图 7.17) 是 ho(n) = 
h(—n)All h(n) = hyn), 所 以 要 求 的 FWT' 综合 滤波 
器 为 go(n)=ho(-n)=ho(n) 和 gi(n)= 有 (=n)= hy(n)。 但 


W n) 





Wj + 1,n) 
应 记 住 ， 也 可 以 使 用 双 正 交 分 析 滤 波 器 和 综合 滤波 
器 ,但 它们 彼此 之 间 形 式 上 顺序 不 相反 。 双 正 交 分 析 Ww,(jn) 
滤波 器 和 综合 滤波 器 是 根据 式 (7.1-10) 和 式 (7.1-11) 
交叉 调制 的 。 交 x pre 
图 7.20 中 的 FEWT- 滤波 器 组 执行 下 述 计算 : 
W, (i+, K) = h, (ky WR G, K+ h, (RW Cj, Ko (7.4-15) 


RP, Ww?" 代表 基 2 上 取样 [ 即 在 式 (7.1-U) 定 义 的 WPA 0， 使 其 长 度 变 为 原来 的 2 倍 ] 上 取 
样 的 系数 与 io 和 ju 人 ) 进 行 卷 积 完成 滤波 ， 并 相 加 产生 较 高 尺度 的 近似 。 本 质 上 ， 这 创建 了 /On) 
的 较 好 近似 ， 含 有 较 多 的 细节 和 较 高 的 分 辩 率 。 与 FWT EERS [— mci 
似 ， 反 变换 滤波 器 组 可 以 如 图 7.21 所 示 的 那样 进行 迭代 。 其 中 ， “| 7.1.1 节 )， 小 波 变换 可 以 按 用 户 指定 
为 了 计算 FWT 重建 的 最 后 两 个 尺度 ,描绘 了 一 个 二 尺度 结构 。 这 | 数量 的 尺度 计算 . 例如 ， 对 于 一 相 大 
种 系数 合并 过 程 可 以 扩展 到 任意 数量 的 尺度 ， 并 保证 序列 /(m) 的 完 | RAE IRR. Boel rar 
美 重建 。 
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W, — 2,n) 


WJ — 2,n) 





例 7.11 ”计算 一 维 快速 小 波 反 变换 。 IS 
ee mt 722 







W,(1, n) = {-3/V2, =3/Y2) 
{4, 0} 


{1,0} 
7.22 ”使 用 哈 尔 尺 度 函数 和 小 波 函数 计算 序列 {1 4 -1.5 V2 , -1.52 V2 } 的 二 尺度 快速 小 波 反 变换 


我 们 通过 解释 傅 里 叶 基 范 数 保证 FFT 的 存在 性 来 结束 快速 小 波 变换 的 讨论 ，FWT 的 存在 性 取决 
于 小 波 变换 的 尺度 函数 的 可 用 性 , 以 及 尺度 函数 和 对 应 小 波 的 正 交 性 (或 双 正 交 性 ) 。 BORE, 式 (7.3-12) 
中 墨西哥 草帽 小 波 的 确 没有 相伴 的 尺度 函数 ， 所 以 不 能 用 于 FWT 的 计算 。 换 句 话 说， 不 能 为 墨西哥 
草帽 小 波 建立 一 个 如 图 7.17 所 示 的 滤波 器 组 ， 因 为 它 不 满足 FWT 方法 的 基本 假设 。 

最 后 ,我 们 注意 到 ， 在 表示 函数 时 ， 时 间 和 频率 通常 被 视 为 不 同 的 域 ， 但 它们 之 间 存 在 着 不 可 分 
割 的 关系 。 如 果 试 图 同时 在 时 间 域 和 频率 域内 对 函数 进行 分 析 ， 就 会 遇 到 如 下 问题 : 如 果 想 得 到 关于 
时 间 域 的 精确 信息 , 就 必须 接受 频率 域 的 某 些 模糊 , 反之 亦 然 。 这 是 海 森 伯 (Heisenberg) 测 不 准 原理 在 
信息 处 理 中 的 应 用 。 为 了 用 图 示 方 式 说 明 该 原理 ， 函 数 表示 中 用 到 的 每 个 基 函 数 都 可 粗略 地 视 为 时 间 - 
频率 平面 中 的 一 片 。 该 片 也 称 为 海 森 伯 单元 或 海 森 伯 爹 ， 它 显示 了 其 所 表示 的 基 函 数 的 频率 内 容 ， 以 
及 该 基 函 数 在 时 域 中 所 处 的 位 置 。 归 一 化 正 交 基 函数 由 不 重 释 的 片 来 表征 。 

7.23 分 别 显示 了 时 间 - 频 率 片 : (a) 冲 激 函数 ( 即 传统 的 时 间 域 ) 基 ; (b) 正弦 函数 (FFT) 基 ; 
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(c)FWT 基 。 图 7.23 (a) 到 (c) 的 每 一 片 都 是 一 个 方形 区 域 ; 区 域 的 高 和 宽 定义 了 可 用 基 函 数 表示 的 函 
数 的 频率 和 时 间 特 性 。 注 意 ， 图 7.23 (a) 中 的 标准 时 域 基 指明 了 事件 发 生 的 时 刻 ， 但 不 提供 频率 信 
息 [图 7.23 (a) 中 每 个 矩形 的 宽度 应 被 考虑 为 时 间 上 的 一 个 瞬间 ) 。 这 样 , 为 了 用 冲 激 基 函 数 表示 一 
个 单一 频率 的 正弦 波 ， 就 需要 每 个 基 函 数 。 另 一 方面 ， 图 7.23 (b) 中 的 正弦 基 指 出 了 发 生 较 长 时 间 
的 事件 中 出 现 的 频率 ， 但 没有 提供 时 间 分 辩 率 [ 图 7.23 (b) 中 每 个 矩形 的 高 度 应 考虑 为 一 个 单一 的 
频率 ) 。 这 样 ， 由 无 限 数量 的 冲 激 基 函数 表示 的 单一 频率 的 正弦 波 ， 就 可 以 表示 为 包含 一 个 正弦 
FE PRR RIPE SK. Fl 7.23 (c) 中 FWT 片 的 时 间 和 频率 分 辩 率 是 变化 的 ， 但 每 个 片 的 面积 相同 。 
在 低频 处 ， 片 较 短 ( 即 有 较 好 的 频率 分 辩 率 或 较 少 的 频率 含糊 ) ， 但 较 宽 (对 于 较 差 的 时 间 分 辩 率 
或 较 大 的 时 间 含 糊 ) 。 在 高 频 部 分 ， 片 宽 较 小 (时间 分 辩 率 提高 ) ， 并 且 片 高 较 大 (表示 频率 分 辩 
率 下 降 ) 。 这 样 ，FWT 基 函 数 就 在 图 7.23 (a) 和 图 7.23 (b) 这 两 种 限制 情况 间 提 供 了 折 中 。FFT 和 
FWT 之 间 的 这 种 基本 差别 在 本 章 的 介绍 中 说 明 过 ， 它 在 频率 随时 间 变 化 而 变化 的 非 稳 态 函 数 的 
分 析 中 很 重要 。 





abe 


频率 























时 间 时 间 时 间 
图 7.23 与 (a) 取 样 数据 ，(b)FFT 和 (c)FWT 相关 的 基 范 数 的 时 间 - 频 
率 片 。 注意 ,图 (c) 中 等 高 度 矩 形 的 水 平 条 带 表 示 FWT 的 尺度 


7.5 三 维 小 波 变换 
前 述 一 维 变 换 可 很 容易 地 推广 到 像 图 像 这 样 的 二 维 函 数 。 在 二 维 情况 下 ， 需 要 一 个 二 维 尺 度 函 数 


(x, 力 和 三 个 二 维 小 波 ye y), we, YA W(x, Yo 每 个 二 维 小 波 都 是 两 个 一 维 函数 的 乘积 。 排 除 产生 
一 维 结果 的 乘积 ， 如 g(x)w(x)，4 个 剩 下 的 乘积 产生 可 分 尺度 函数 


P(x, y)=9(x)P() (7.5-1) 
和 可 分 的 “方向 敏感 ”小 波 

v" (x, y) =v) | (1.5-2) 

yx, y =p) (7.5-3) 

y” (x, y) =y) (7.5-4) 


这 些小 波 度量 函数 的 变化 -图 像 的 灰 度 变化 -一 沿 不 同方 向 的 变化 : y 度量 沿 列 方向 的 变化 (例如 水 平 
边缘 ) W 响应 沿 行 方向 的 变化 (例如 垂直 边缘 ) ， 度量 对 应 对 角 线 方向 的 变化 。 方 向 敏感 是 式 (7.5-2) 
到 式 (7.5-4) 中 可 分 性 的 自然 结果 ; 它 并 不 会 增加 本 节 讨 论 的 二 维 变换 的 计算 复杂 性 。 

给 定 可 分 二 维 尺度 函数 和 小 波 函 数 ， 一 维 DWT 可 直接 扩展 到 二 维 。 我 们 首先 定义 一 个 尺度 和 平 BE 
移 基 函数 : 








26) 
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Pj, m, n(%s Y) = 2! (2! x—m, 2/y—n) (7.5-5) 


Wi m nl% ¥) = 2/7 y' (2/x-m, 2/y-n), i={H, V, D} (7.5-6) 


式 中 ， 上 标 i 指 出 式 (7.5-2) 到 式 (7.5-4) 中 的 方向 小 波 。 与 指数 不 同 , i BEM H, VD WEER F 
是 ， 大 小 为 Mx NN 的 图 像 f(x,y) 的 离散 小 波 变换 是 


M- N-1 


| 
W, Ci > M, MW) eS TAEA y) nmn y) (7.5-7) 
hia VMN 22 
| LYS fle WY) (H, v, D} (758) 
Wy CV, m, na SG, yy, na y)s i= H; V, D 7.5-8 
á l MN x=0 y=0 á : 


如 同一 维 情况 ,加 是 一 个 任意 的 开始 尺度 ，Wlji m, nn) 系数 定义 f OY) ARECA AAR, I 
在 尺度 Jo RAEI. Wy, m,n) 系数 对 尺度 > jo BINT ACE. EEM | ws3) 是 一 个 离散 函数 或 值 序列 , 而 x 
对 和 角 方 向 的 细节 。 我 们 通常 令 训 =0， 并 选择 N=M=2， 因 此 有 j=0, 1，| 下》 古 离 散 变 量 。 式 (07.5-7) AR 


i (7.5-8) 中 的 尺度 和 小 波 函 数 是 在 它 | 
2,--+, J-1 和 m=n=0,1,2,…,2-1。 给 出 式 (7.5-7) 和 式 (7.5-8) 中 的 夯 ，| 们 的 支撑 上 取样 的 (就 像 在 7.3.2 节 的 | 


AW) ,f(x,y 可 通过 离散 小 波 反 变换 得 到 : is aed 





P= FD Molar m Pj, mal D+ 
i r- (7.5-9) 
Eh m, myn, n(% Y) 

类 似 于 一 维 离散 小 波 变换 ， 二 维 DWT 可 以 使 用 数字 滤波 器 和 下 取样 器 来 实现 。 利 用 可 分 的 二 维 
尺度 函数 和 小 波 函 数 ， 我 们 可 以 先 简 单 地 取 了 (x, y) 的 行 的 一 维 FWT， 然 后 ， 取 结果 列 的 一 维 FWT., 
图 7.24 (a) 以 方 框图 的 形式 显示 了 这 一 过 程 。 注 意 ， 类 似 于 图 7.17 的 一 维 对 应 部 分 ， 二 维 FWT “滤波 ” 
尺度 j+1 的 近似 系数 来 构建 尺度 j 的 近似 和 细节 系数 。 但 在 二 维 情况 下 ,我 们 得 到 了 3 组 细节 系数 一 
水 平 、 垂 直 和 对 角 线 细节 系数 

图 7.24 (a) 的 单 尺度 滤波 器 组 可 通过 “ 渤 代 ”( 将 该 近似 输出 连接 到 另 一 个 滤波 器 组 输入 ) 方式 ,在 
尺度 j= 一 1,7-2,…,J-P 中 产生 尺度 变换 ,如 一 维 情形 那样 ,图 像 fe 被 用 做 TV, m, 办 的 输入 。 
它 的 行 与 holm Al hy GB, JOM CAI FRE, BRITS, 
它们 的 水 平分 关 率 以 2 HEF. PERMANET RNEER | W W. W 
向 的 高 频 信息 ， 低 通 或 近似 分 量 包含 了 低频 垂直 信息 。 然 后 ， 沿 列 的 “| 中 的 方式 排列 。 计算 出 的 每 
方向 对 两 幅 子 图 像 进行 滤波 并 下 取样 ， 得 到 4 幅 1/4 大 小 的 输出 子 图 ERED ERE TOE 
&—_W,, Wy. Wy BIW? 。 显 示 于 图 7.24(b) 中 间 的 这 些 子 图 像 是 f(x, 办) 与 式 (7.5-1) 到 式 (7.5-4) 中 
的 二 维 尺度 函数 与 小 波 函数 的 内 积 ， 紧 接着 在 每 个 维度 进行 基 2 下 取样 。 滤 波 处 理 的 两 次 兴 代 在 
图 7.24(b) 的 最 右 侧 产生 二 尺度 分 解 。 

图 724(c) 显示 了 刚刚 描述 过 的 反 向 处 理 的 综合 滤波 器 组 。 如 所 期 望 的 那样 ,重建 算法 类 似 于 -- 维 
情况 。 在 每 次 迄 代 中 ， 四 尺度 j 的 近似 和 细节 子 图 像 被 上 取样 ， 并 与 两 个 一 维 滤波 器 卷 积 一 个 在 
子 图 像 的 列 上 进行 操作 ， 另 一 个 在 行 上 进行 操作 。 将 结果 相 加 得 到 尺度 /+ 1 的 近似 , 重复 该 处 理 吉 到 
重建 原 图 像 。 
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图 724 “二 维 快速 小 波 变换 : (a) IER; (O) 分 解 结果 ; (c) 综 合 滤波 器 组 
ee haere ES HER 
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1/4 eS O 4 个 1/4 大 小 (现在 是 原 图 像 的 1/16) 的 分 解 结果 代替 , 它们 由 第 二 次 滤波 产生 。 最 


， 当 图 7.25 (c) 左上 角 的 子 图 像 作为 滤波 器 组 的 输入 时 ， 图 7.25 (d) 是 得 到 的 三 尺度 的 FWT。 每 次 通过 滤 
ria 便 会 产生 4 1/4 大 小 的 输出 图 像 , LURET E CRDA TE EINER WW 和 WW? 
在 每 个 尺度 处 的 方向 特性 。 Bee Vt | 


abed 





图 7.25 计算 二 维 三 尺度 FWT: (a) 原 图 像 ，(b) 一 尺度 FWT; (c) RE FWT; (d) 三 尺度 FEWT 


h(n) = h(—n) hy(n) = hy(—n) Kot) = Atri) 
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图 7.26 四 阶 对 称 小 波 : (a) ~ (b) 分 解 滤波 器 ; (c)~(d) 重建 滤波 器 ; (e); OE 
尺度 函数 ; (g) 三 个 二 维 小 波 之 一 ，W (Ce y)o h(n), O<n <TR 7.3 
前 面 例子 中 使 用 的 分 解 滤波 器 是 众所周知 的 称 为 对 称 小 波 的 小 波 族 的 一 部 分 。symlet 是 对 称 小 
波 的 英文 简称 。 虽 然 它们 不 完全 对 称 ， 但 在 给 定 的 紧 支 撑 下 (Daubechies[1992]) 被 设计 为 有 最 小 不 对 
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称 性 和 最 高 消失 矩 数 。 图 7.26(e) 和 图 7.26 (显示 了 4 阶 一 维 对 称 小 es hcg en: 
波 ( 即 小 波 和 尺度 函数 ) 。 图 7.26(a) 到 图 7.26 (d) 显示 了 相应 的 分 解 和 重 | ci, 沪 丽 数 在 这 个 区 间 内 有 非 
建 滤波 器 。 ki i s e go(n) 三 h(n) 的 系数 在 0 < n <7 的 情况 下 由 | 零 值 。 
表 7.3 给 出 。 其 余 归 一 化 正 交 滤波 器 的 系数 可 用 式 (7.1-14) 得 到 。 作 为 小 波 w(x, y) 的 低 分 状 率 图 解 ， 
图 7.26 四 涪 明了 -_ 维 尺度 和 小 波 函数 是 如 何 结合 合 在 一 起 
来 形成 一 个 可 分 三 维 小 波 的 。 

我 们 用 两 个 演示 小 波 在 图 像 处 理 中 的 作用 的 例子 来 
结束 本 节 。 如 在 传 里 叶 域 那样 ， 基 本 方法 是 : 

步骤 1 计算 一 幅 图 像 的 二 维 小 波 变换 。 

步骤 2 修改 变换 。 

步骤 3 计算 反 变换 。 

因为 DWT 的 尺度 和 小 波 向 量 被 用 做 低 通 和 高 通 滤 
波 器 ， 所 以 大 多 数 基于 传 里 叶 的 滤波 技术 与 “小 波 域 ” 
部 分 是 等 价 的 。 


例 7.13， 基于 小 波 的 边缘 检测 。 

图 7.27 提供 了 前 面 又 6 简单 说 明 。 在 图 7 aat, 示 于 图 725 (O 的 离散 小 波 变换 的 最 低 尺 度 
近似 分 量 已 由 将 其 什 置 零 而 消除 。 如 图 7.27 (b) 所 示 , 使 用 这 些 改 进 的 系数 计算 小 波 反 变换 时 , 最终 效 果 是 边 
缘 增强 ， 回 忆 一 下 在 4.9 节 讨 论 的 基于 傅 里 叶 的 图 像 锐 化 结果 。 注 意 ， 尽 管 它们 是 相对 软 的 正弦 过 渡 ， 但 信 

aa ae 通过 将 水 平 细节 置 零 一 参见 图 7.27(c) 和 图 7.27 (a) ,我 们 可 
以 孤立 出 垂直 边缘 。 


表 7.3 h(n) 的 正 交 归 一 化 四 阶 对 称 小 波 
滤波 器 系数 (Daubechies[1992]) 








abed 

















图 7.27 针对 边缘 检测 改进 的 DWT: (a)~(c) 删 除 所 选 系数 的 二 尺度 分 解 ;(b)~(d) 相 应 的 重建 


例 7.14 ”基于 小 波 的 噪声 去 除 。 
作为 第 二 个 例子 , 考虑 示 于 图 7.28 (a) 中 的 人 体 头 部 CT 图 像 。 正 如 在 背景 中 所 看 到 的 那样 ， 图 像 已 被 
加 性 白 噪声 均匀 污染 。 通 常 ， 基 于 小 波 来 对 图 像 去 噪 ( 即 消除 噪声 部 分 ) 的 过 程 如 F:; 


步骤 1 为 了 分 解 ， Be NS 对 称 小 波 等 ) 和 级 别 数 \ 尺 度 )P。 然 后 ， 计 算 噪 声 图 像 
AYFWT. 

步骤 2 对 细节 系数 进行 逆 值 处 理 ， 即 从 尺度 J-1 1 到 J-P， 选择 和 应 用 一 个 国 值 处 理 细节 系数 。 这 可 
以 通过 硬 阔 值 来 实现 ， 其 含义 是 将 绝对 值 低 于 阔 值 的 元 素 置 零 ， 或 通过 软 闵 值 处 理 实现 ， 即 首先 将 其 
绝对 值 比 闭 值 低 的 元 素 置 零 ， 然后 将 非 零 系数 标定 到 接近 零 。 软 阔 值 处 理 消除 了 硬 阔 值 处 理 中 Ze 
值 处 ) 固有 的 不 连续 性 ( 见 第 10 章 关于 阔 值 处 理 的 讨论 ) 。 


D iE y O) 的 第 大 阶 矩 是 m( = hydre 0 阶 和 矩 影响 尺度 函数 和 小 波 函 数 的 平滑 性 以 及 我 们 将 它们 表示 为 多 项 式 的 能 力 。 
和 N 阶 对 称 小 波 有 NM 个 消失 矩 。 
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步骤 3 在 ./-P 级 处 使 用 原始 近似 系数 ,并 对 级 -1 到 YeP 的 改进 细节 系数 计算 小 波 反 变 换 ( 即 执行 
小 波 重建 ) 。 








图 7.28 ”为 噪声 去 除 修 改 DWT: (a) 人 的 头 部 的 噪声 CTER; (b), (c) 和 (e) 对 细节 系数 进行 闵 值 处 理 后 的 
各 种 重建 ，(d) FO E (o) 和 (e) 重建 过 程 中 所 删除 的 信息 ( 原 图 像 由 Vanderbilt 大 学 医学 中 心 提供 ) 


图 7.28 (b) 显示 了 使 用 第 四 阶 对 称 小 波 、 二 尺度 (P = 2) 及 一 个 交互 确定 的 全 局 浆 值 来 执行 这 些 操 作 的 
结果 。 注 意 噪 声 的 减少 和 相应 图 像 边 缘 的 模糊 。 这 种 边缘 细节 的 损失 在 图 7.28 (c) 中 大 大 减少 ， 它 是 由 
最 高 分 辩 率 细节 系数 (不 是 低 分 辨 率 细节 的 阔 值 处 理 ) 简单 置 零 并 重建 图 像 产生 的 。 这 里 ， 几乎 所 有 的 背 
TEAC AEH, 而 边缘 仅 稍 有 干扰 。 图 7.28 (由 中 的 差 值 图像 显 示 了 [ ERETO, EENT 
处 理 中 丢失 的 信息 。 这 个 结果 是 计算 两 尺度 变换 所 有 系数 ， 但 高 分 辩 率 ， 高 分 关 率 细节 系数 ， 故 该 反 变 换 是 
细节 系数 为 零 的 反 FWT 产生 的 。 如 所 看 到 的 那样 ， 结果 图 像 中 包含 了 对 in 同样 , FAI 7.28 (1) | 
原 图 像 中 的 大 多 数 噪声 和 某 些 边缘 信息 。 图 728(e) 和 图 7.28 (作品 示 了 要 
删除 所 有 细节 系数 的 负面 影响 .也 就 是 说 ,图 7.28(e) 是 在 两 尺度 变换 的 两 个 级 别 的 细节 被 置 零 时 的 DWT 
重建 ; A7280 显示 了 丢失 的 信息 。 注 意 , 图 7.28 (中 的 边缘 信息 明显 增加 ， 而 图 7.28 (e) 中 的 边缘 细 
节 相 应 减少 。 


7.6 MRE 


快速 小 波 变 换 将 一 个 函数 分 解 为 宽度 旦 对 数 关系 的 尺度 函数 和 小 波 函 数 的 和 ， 即 (函数 的 ) 低 频 内 容 
使 用 较 罕 带宽 的 (尺度 和 人 小波) 函数 来 表示 ， 而 高 频 内 容 使 用 较 宽 带宽 的 函数 来 表示 。 如 果 沿 图 7.23 (c) 
中 的 时 间 - 频 率 平面 的 频率 轴 来 看 ， 这 非常 明显 。 每 个 恒定 高 度 片 的 水 平 条 带 包含 单一 FWT 尺度 的 基 
函数 , 向 上 移动 频率 轴 时 , 在 高 度 上 呈 对 数 增加 。 如果 我 们 想 要 更 大 地 控制 时 间 - 频 率 平面 的 分 开 度 ( 即 
在 较 高 频率 处 频带 较 小 ) ， 则 必须 对 FWT 加 以 推广 ， 以 便 得 到 一 个 更 为 灵活 的 分 解 ， 这 种 分 解 称 为 小 
波 包 (Coifman and Wickerhauser[1992]) 。 这 个 推广 的 代价 是 计算 复杂 性 从 FWT 的 OCM) 增 大 到 小 波 包 
的 O(Mlog;M)。 

再 次 考虑 图 7.18 (a) 中 的 二 尺度 滤波 器 组 , 但 此 时 把 分 解 想象 为 一 个 二 又 树 。 图 7.29 (a) 详细 叙述 了 
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树 的 结构 ， 并 适当 地 将 FWT 尺度 和 小 波 系数 [ 从 图 7.18 (a) ] 连接 到 它 的 节点 。 根 节点 被 赋予 了 最 高 


尺度 的 近似 系数 ， 它 是 函数 本 身 的 样本 ， 叶 子 节点 继承 了 该 变换 的 近似 和 细节 系数 输出 。 单 独 的 中 间 
HA Wj( 厂 1, nn) 是 滤波 器 组 近似 ， 该 近似 最 终 被 滤波 而 变 成 两 个 叶子 节点 。 注 意 ， 每 个 节点 的 系数 都 
是 线性 展开 的 加 权 ， 它 产生 根 节点 f(n) 的 一 个 带 限 “ 片 ”"。 因 为 任何 这 样 的 “ 片 ” 都 是 一 个 已 知 尺度 
或 小 波 子 空间 的 元 素 ( 见 7.2.2 节 和 7.2.3 节 ) ， 所 以 可 以 用 相应 的 子 空间 来 替代 图 7.29 (a) 中 的 生成 系数 。 
结果 是 图 7.29 (b) 中 的 子 空间 分 析 树 。 虽 然 变量 W 用 于 表示 系数 和 子 空间 ， 但 两 个 量 按 它 们 的 下 标 格 
式 是 可 区 分 的 。 


ab W,U.n) = fn) v. 


J 
WU —1,n) W,(J—-1,n) Vi=4 Wii 
W,(J-2,n) W,,(J—2,n) Vj-2 Wy-2 


图 7.29 图 7.18 中 二 尺度 FWT 分 析 组 的 (a) 系数 树 和 (b) 分 析 树 


图 7.30 中 进一步 说 明了 这 些 概 念 ， 其 中 描绘 了 一 个 三 尺度 FWT 分 析 组 、 分 析 树 和 相应 的 频谱 。 与 
图 7.18 (a) 不 同 ， 图 7.30 (a) 中 的 方 框图 标明 了 类 似 于 图 7.30(b) 所 示 的 分 析 树 和 图 7.30 (c) 所 示 的 频谱 。 这 
样 , 尽管 左上 滤波 器 和 子 取样 器 的 输出 是 WAL, n), 但 为 准确 起 见 标 为 到 ;一 一 即 由 丈 人 (大 1 四 变换 系 
数 产 生 的 函数 子 空间 。 这 个 子 空间 对 应 于 相关 分 析 树 中 的 右上 边 的 叶子 , 以 及 相应 频谱 的 最 右 (最 宽带 
宽 ) 段 。 





f(x)eVy 








Viz 





Vj-3 Wy-s 





0 n8 n n/2 
图 7.30 三 尺度 FWT 滤波 器 组 : (a) 方 框图 ; (b) 分 解 空间 树 ; (〈c) 频谱 分 离 特 性 


分 析 树 提供 了 表示 多 尺度 小 波 变换 的 一 种 紧凑 上 且 有 益 的 方法 。 与 基于 滤波 器 和 子 取样 器 的 相应 方 
框图 相 比 , 分 析 树 画 起 来 很 简单 , 且 占 用 的 空间 较 少 , 因此 能 相对 容易 检测 有 效 的 分 解 。 例如 , 图 7.30 (b) 
的 三 尺度 分 析 树 使 得 如 下 三 种 展开 选项 成 为 可 能 : 
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Vr = Vja OW; (7.6-1) 
V; =V; 29W; 2 OW,, (7.6-2) 


它们 对 应 于 7.4 节 的 一 尺度 、 Stee aaa FWT ah 并 可 由 7.2.3 节 的 式 (7.2-27) 对 P= {1, 2, 3}4 jo = 
J 一 也 来 得 到 。 通常 ，P 尺 度 FWT 分 析 树 支持 唯一 的 己 种 分 解 。 

分 析 树 还 是 表示 小 波 包 的 一 种 有 效 机 制 ， 小 波 包 只 不 过 是 细节 为 交互 滤波 的 传统 小 波 变 换 。 这 
样 ， 图 7.30 b) 中 的 三 尺度 FWT 分 析 树 就 变 成 了 图 7.31 中 的 三 尺度 小 波 包 树 。 注意 ， 引 入 了 附加 的 
下 标 。 双 下 标 节点 的 第 一 个 下 标 可 视 为 传承 FWT 父 节点 的 尺度 ， 第 二 人 的 变 长 字 
符 串 一 一 是 从 父 节 点 到 该 节点 的 路 径 的 编码 。4 表示 近似 滤波 ,而 D 表示 细节 滤波。 例如 ， 子 空间 
矿 六 oz 是 通过 一 个 附加 的 细节 滤波 器 对 尺度 大 1 的 FWT 系数 (如 图 7.31 中 的 父 节点 到 1)“ 滤 波 ”( 得 
到 到 /1.p) ， 接 着 用 一 个 近似 滤波 表 进 行 滤波 (给 出 Wai, ps) 得 到 的 。 图 7.32(a) 和 图 7.32 (b) 是 图 7.31 
中 分 析 树 的 滤波 器 组 和 频谱 分 离 特性 。 注 意 ， 图 7.32 (a) 中 的 滤波 器 组 的 “自然 顺序 ”输出 ,已 根据 
图 7.32 (b) 中 的 频率 内 容 被 重新 排序 (关于 “频率 排序 ”小 波 的 更 多 内 容 ， 见 习题 7.25) 。 


| J 回忆 可 为 ,， @ 表示 空间 的 并 集 (就 像 














Vr Wi 集合 的 并 集 一 样 ) 。 与 图 731 相关 的 26 
种 分 解 是 由 [可 被 组 合 到 一 起 来 表示 树 
a Ay roe Pe DERRE 的 ] 节 点 (空间 ) 的 
W-D 不 同 组 合 产生 的 。 式 (7.64) 和 式 
Fi Ea T T Pe SS i NS (0765) 定 义 了 两 个 这 样 的 分 解 
Wn WIZA Wyo. Wy-1, 4A W-ap Wy-1,pa Wi-1,pp 
图 7.31 一 个 三 尺度 小 波 包 分 析 树 


图 7.31 中 的 三 尺度 小 波 包 树 的 分 解数 量 ( 及 相关 的 时 间 - 频 率 片 ) 几乎 是 三 尺度 FW 树 的 3 倍 。 回 
顾 可 知 ， 在 标准 的 FWT 中 ,我 们 单独 对 低 通 波段 进行 分 离 、 滤 波 和 下 取样 。 这 将 在 用 于 函数 表示 的 
尺度 和 小 波 空 间 的 波段 宽度 之 间 形 成 一 个 固定 的 对 数 ( 以 2 为 底 ) a 见 图 7; x (c) LEE, ÆR 7.30 (a) 
中 的 三 尺度 FWT 分 析 树 提供 三 种 可 能 的 分 解 时 一 一 由 式 (7.6- 
包 树 支持 26 种 不 同 的 分 解 。 例 如 ， 妨 [和 函数 /(n) ] 可 展开 为 





Vj=V, 3 DW, 3 BW, ,4® W,,p® Wa ® Wj aD OW pa ® Wi, DD (7.6-4) 
它们 的 频谱 如 图 7.32 (b) 所 示 ; 或 者 
V,=V,,® Wy, 4® Wy, pa ® Wy, DD (7.6-5) 


它们 的 频谱 在 图 7.33 中 进行 了 描述 。 注 意 ， 这 个 最 后 的 谱 和 图 7.32 (b) 中 的 完全 小 波 包 谱 或 图 7.30(c 
中 的 三 尺度 FWT 谱 之 间 的 区 别 。 一 般 来 说 ,，P 尺度 一 维 小 波 包 变换 (与 P+ 1 层 分 析 树 相关 ) 支持 


D(P+1)=[D(P)] +1 (7.6-6) 


个 唯一 的 分 解 ,其 中 D1) = 1。 随 着 这 样 的 大 量 有 效 展开 ,基于 包 的 变换 就 提供 了 改进 被 分 解 函 数 的 
二 谱 的 分 割 控制 。 这 种 控制 的 代价 就 是 计算 复杂 性 的 增加 [将 图 7.30 (a) 中 的 滤波 器 组 与 图 7.32 (a) 进 


| 行 比较 ]。 
536 
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* h(—n) Wj_1pa 
* hy(—n) Wy-1,ap 


* h(n) H 21 Wy-1,4A 


* hy(—n) 21 WwW, -2 0 
ece 


Xha) H 21 Wj-2,4 


fœ)eV; 








* h(n) H 21 W)-3 








xhan) H 2) eV 
|H(w)| 





~ Vy CC 
Vy. 1 Wj-i 





i} 
ND We ! 
| | : | : | 





0 T/S n /4 元 /2 T 
图 7.32 ”三 尺度 完全 小 波 包 分 析 树 的 (a) 滤波 器 组 和 (b) 频谱 分 离 特 性 
|H(@)| 







Ws-1,paqWy-1,p1 


0 t/2 S5n/8 3n/4 T 
图 7.33 式 (7.6-5) 中 分解 的 频谱 


现在 考虑 图 7.24 (a) 中 的 二 维 、 四 子 带 滤波 器 组 。 如 7.5 节 中 解释 的 那样 ， 它 将 近似 WC + 1, m, n) 分 
解 成 输出 Wj, m, n), wh (j, m, n), wy (j, m, n) 和 wW? (j, m, n)。 如 在 一 维 情况 那样 ， 在 W,(J, m, n) = 
fim n) 的 情况 下 ， 这 个 过 程 可 以 对 尺度 j= 三 1, -2,…,J-P 反复 迭代 而 生成 P 尺 度 变换 。 第 一 次 迭代 

[ 即 用 图 7.24 (a) 中 的 j+ 1=J 了 ] 得 到 的 频谱 示 于 图 7.34 (a) 。 注 意 ， 它 将 频率 平面 分 成 了 4 个 相等 的 
区 域 。 位 于 平面 中 心 的 低频 1/4 频带 与 变换 系数 WAL, m, n) 及 尺度 空间 太一 致 (这 种 命名 法 与 一 维 情 
况 下 一 致 ) ,然而 ,为 适应 输入 的 二 维特 性 ,我 们 现在 有 3 个 (而 非 1 个 ) 小 波 子 空间 。 它 们 分 别 表示 为 下 六， 
Wi 和 到 PP ， 并 对 应 于 系数 到 和 (J 一 1, msn) Wy (J 一 1,m,n) AW? (J 一 1,m,n)。 图 7.34(b) 显示 了 得 到 
的 四 子 带 、 单 尺度 的 四 分 义 的 FWT 分 析 树 。 注 意 上 标 ， 它 们 将 小 波 子 空间 标志 及 其 对 应 的 变换 系数 
联系 在 一 起 。 
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=a 


图 7.34 一 个 二 维 FWT 的 第 一 次 分 解 : (a) 频谱 ; (b) 子 空间 分 析 树 


图 7.35 显示 了 一 个 三 尺度 、 二 维 小 波 包 分 析 树 的 一 部 分 。 如 图 7.31 中 它 对 应 的 一 维 部 分 那样 ， 
传统 FWT 细节 节点 的 每 个 下 一 代 节 点 的 第 一 个 下 标 , 都 是 其 父 细节 节点 的 尺度 。 第 二 个 下 标 ( 一 个 4， 
H, VAD 的 变 长 字符 串 ) 对 从 父 节点 到 当前 节点 的 路 径 进行 编码 。 例 如 ， 标 记 为 瑟 上 yo 的 节点 是 首先 
用 一 个 附加 的 细节 /近似 滤波 器 对 尺度 为 了 -1 的 FWT 水 平 细节 系数 ( 即 图 7.35 中 的 父 节点 到 ) 进行 

“ 行 / 列 滤波 ”( 生 成 更 包 ,) ， 然 后 用 一 个 细节 /细节 滤波 器 对 它 再 次 进行 滤波 BIW yy) FEIN. 
一 个 P 了 尺度 的 二 维 小 波 包 树 支持 唯一 展开 
D(P+D=[DCP] +1 (7.6-7) 


其 中 D(1)=1。 因 此 ,图 7.35 中 的 三 尺度 树 提供 了 -83 522 种 可 能 的 分 解 。 在 它们 中 间 进 行 选择 的 问题 


是 下 一 个 例子 的 主题 。。 
ge ea 


H v D 
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图 7.35 一 个 三 尺度 、 完 全 小 波 包 分 解 树 。 只 给 出 了 树 的 一 部 分 


Aaien" kri kag bn 9 
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8 x 8 阵列 的 子 带 。 然 而 ， 以 压缩 为 目的 而 使 这 种 特定 的 64 个 叶子 的 分 解 达到 某 种 程度 优化 的 可 能 性 相对 
较 低 。 在 缺乏 一 种 合适 的 最 佳 准则 时 ， 我 们 既 不 能 确认 也 不 能 否认 这 种 分 解 是 否 最 佳 。 


aa | [et | E 
YN =| 






图 7.36 (a) 一 幅 扫描 的 指纹 图 像 ; (pb) 该 图 像 的 三 尺度 、 全 小 波 包 分 解 ( 原 图 像 由 美国 国家 标准 与 技术 协会 提供 ) 


对 图 7.36 (a) 图 像 的 压缩 选择 的 一 种 合理 分 解 准则 是 附加 的 代价 函数 
下 内 三 > fm, 训 (7.6-8) 


该 函数 为 二 维 函 数 了 的 能 量 内 容 提供 了 可 能 的 度量 。 在 该 度量 下 ， 对 于 所 有 的 wn 和 hn， 丙 数 /(m, n) = 0 的 
能 量 为 零 。 另 一 方面 ,五 的 高 值 表 明 函 数 具有 很 多 非 零 值 。 由 于 大 多 数 基 [一 一 
于 变换 的 压缩 方案 都 是 通过 合 信 或 设置 六 值 将 很 小 的 系数 变 成 零 值 来 工 i | 
作 的 ， 因 此 ， 从 压缩 的 观点 来 看 ， 将 接近 零 值 的 数量 最 大 化 的 代价 函数 ， em 
对 于 最 好 的 分 解 应 该 是 合理 的 准则 。 has nue 

刚才 提 到 的 代价 函数 不 仅 计算 简单 而 且 易于 适应 树 的 优化 程序 。 最 优化 算法 必须 使 用 这 个 函数 来 最 
小 化 分 解 树 中 时 节点 的 “代价 ”。 最 小 能 量 叶 节 点 应 该 是 最 受 欢迎 的 ， 因 为 这 些 节点 上 有 更 多 接近 零 的 数 
值 , 从 而 导致 更 大 的 压缩 ; 因为 式 (7.6-8) 的 代价 函数 只 是 一 个 局 部 度量 , 它 只 用 在 考虑 节点 的 有 效 信息 上 ， 
所 以 很 容易 构造 一 个 用 于 得 到 最 小 能 量 的 有 效 算法 。 

对 于 分 析 树 的 每 个 节点 ， 要 从 根 节 点 开始 逐 层 进行 ， 直 到 到 达 叶 子 节点 : 


步骤 1 计算 节点 的 能 量 。 用 应 (作为 父 节点 的 能 量 ) 表示 ， 并 且 该 节点 的 4 个 子 节点 的 能 量 分 别 表示 
HEA, EH, EV 和 EDp。 对 于 二 维 小 波 包 分 解 ， 父 节点 是 近似 系数 或 细节 系数 的 一 个 二 维 阵列 ; 子 节 
点 分 别 是 滤波 后 的 近似 、 水 平 、 垂 直 和 对 角 线 细节 。 | 

步 又 2， 如 果子 节点 的 联合 能 量 小 于 父 节点 的 能 量 , 即 E, + Ey+ By + Ep< Ep, 则 在 分 析 树 中 包含 这 些 
子 节 点 。 如 果 各 子 节点 的 联合 能 量 大 于 等 于 父 节点 的 能 量 ， 则 修剪 掉 这 些 子 节点 而 只 保留 父 节点 。 它 
就 是 优化 分 析 树 的 叶子 节点 。 


前 述 算法 可 以 用 于 : (1) 对 小 波 包 树 进行 修剪 ,或 2) 从 零 开 始 设 计 用 于 计算 最 优 树 的 过 程 。 在 后 一 种 
情况 下 ,不 必要 的 兄弟 节点 一 一 那些 在 算法 的 第 二 步 中 将 去 掉 的 节点 后 代 一 -不 用 计算 。 图 7.37 显示 了 优 
化 后 的 分 解 ， 该 分 解 是 使 用 式 (7.6-8) 的 代价 函数 对 图 7.36(a) 中 的 图 像 应 用 此 算法 得 到 的 。 图 7.38 中 给 出 了 
对 应 的 分 析 树 。 注 意 ， 图 736(6) 中 多 个 原始 的 全 小 波 包 分 解 的 64 个 子 带 ( 和 图 7.35 中 对 应 分 析 树 的 64 
个 叶子 ) 已 被 去 除 。 另外， 图 7.37 中 未 被 分 离 (或 进一步 分 解 ) 的 子 图 像 相 对 比较 平滑 ， 它 们 由 那些 具有 中 
间 灰 度 值 的 像素 构成 。 除了 近似 子 图 像 ， 该 图 中 的 所 有 子 图 像 都 已 被 标定 , 所 以 灰 度 级 128 指示 零 值 系数 ， 
因此 这 些 子 图 像 几 乎 不 包含 能 量 。 对 这 些 子 图 像 的 分 离 应 不 会 总 体 降低 图 像 的 能 量 。 
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图 7.38 对 图 7.37 中 分 解 的 最 佳 小 波 包 分 析 树 


前 述 例子 是 以 实际 问题 为 基础 的 ， 它 可 以 使 用 小 波 来 解决 。 近 年 来 ， 美 国联 邦 调查 局 (FBI) 建立 
了 一 个 巨大 的 指纹 数据 库 ， 并 为 指 指纹 图 像 的 数字 化 与 压缩 制定 了 一 个 基于 小 波 的 国家 标准 
(FBI[1993]) 。 由 于 使 用 了 双 正 交 小 波 ， 这 个 标准 达到 了 典型 的 15 :1 的 压缩 率 。 小 波 压 缩 方 法 相对 于 
传统 JPEG 压缩 方法 的 优点 会 在 下 面 的 章节 中 得 到 检验 。 

例 7.15 中 使 用 的 分 解 滤波 器 和 FBI 使 用 的 都 是 周知 的 称 为 Cohen Daubechies Feauveau 双 正 交 小 波 
(Cohen, Daubechies and Feauveau[1992]) 的 小 波 家 族 的 组 成 部 分 。 因 为 该 小 波 族 的 尺度 函数 和 小 波 函 数 是 
对 称 的 ， 并 且 具 有 相近 的 长 度 ， 所 以 它们 是 使 用 最 广泛 的 双 正 交 小 波 。 图 7.39(e) 到 (h) 显示 了 双 尺 度 函 
数 和 小 波 函 数 。 图 7.39 (a) 到 (d) 是 对 应 的 分 解 滤波 器 和 重建 滤波 器 。 当 0 <n < 17 时 , 低 通 和 高 通 分 解 滤 
UAE ho(n) 和 加 (n) 的 系数 如 表 7.4 所 示 。 相 应 的 双 正 交 综 合 滤波 器 的 系数 可 使 用 式 (7.1-11) 中 的 gom)=(-17 
(WW) 和 gi(n)=(-17'ho(m) 来 计算 。 也 就 是 说 ， 它 们 是 分 解 滤波 器 的 交叉 调制 形式 。 注 意 ， 为 使 得 这 些 滤波 


如 的 长 度 相同 ,使 用 了 零 填 充 , 且 表 7.4 和 图 7.39 根据 图 7.6(a) 中 的 子 带 编码 和 解码 系统 定义 了 这 些 滤 波 器 ; 
sao) 就 FWT Mie, Ah, (Cn) =h (n) Rh, (n) = h(n) o 
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表 7.4 WEZ Cohen Daubechies Feauveau 滤波 器 系数 (Cohen, Daubechies and Feauveau[1992]) 
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图 7.39 Cohen Daubechies Feauveau 双 正 交 小 波 族 的 成 员 : (a) 和 (b) 分 解 滤波 器 系数 ; (c) 和 (d) 重 
建 滤波 器 系数 ; (e)~ (h 双 小 波 和 尺度 函数 。0 对 nn < 1785F, h(n) A h(n) 的 值 见 表 7.3 
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小 结 


本 章 为 理解 和 深入 掌握 图 像 处 理 中 小 波 与 多 分 辨 率 分 析 的 作用 ,奠定 了 牢固 的 数学 基础 。 小 
波 和 小 波 变换 是 在 大 量 图 像 处 理 课题 中 快速 崛起 的 、 相 对 较 新 的 图 像 工 具 。 由 于 它们 与 傅 里 叶 变 
换 具 有 相似 性 ， 所 以 第 4 章 中 的 许多 技术 同样 具有 对 应 的 小 波 域 部 分 。 成 像 应 用 中 能 以 小 波 的 观 
点 来 解决 的 问题 ， 包 括 图 像 匹 配 、 配 准 、 分 割 、 降 噪 : 复原 、 增 强 、 压 缩 、 形 态 滤波 和 计算 机 断 
层 等 。 由 于 不 可 能 在 一 章 中 覆盖 所 有 这 些 应 用 领域 ， 所 以 根据 它们 的 价值 ， 只 选择 了 部 分 主题 进 
行 介绍 ,或 阐明 它们 的 基本 概念 ， 为 读者 在 该 领域 中 的 深入 研究 打下 基础 。 第 8 章 将 使 用 小 波 进 
行 图 像 压缩 。 


参考 文献 


小 波及 其 应 用 领域 的 教材 很 多 ， 其 中 一 些 可 作为 我 们 论述 的 补充 ; 我 们 在 阐述 本 章 的 核心 内 容 时 ， 
依靠 的 也 是 这 些 教材 。7.1.2 节 中 关于 子 带 编码 和 数字 滤波 的 内 容 , 来 源 于 Vetterli and Kovacevic[1995], 
7.2 节 和 7.4 节 中 关于 多 分 辨 率 展开 和 快速 小 波 变 换 的 内 容 , 来 源 于 Burrus, Gopinath and Guo[1998]。 本 
章 中 的 其 他 内 容 则 来 源 于 教材 中 的 参考 文献 ,本 章 中 的 所 有 例子 均 使 用 MATLAB 实现 ( 见 Gonzalez et al. 
[2004]) 。 

小 波 分 析 的 历史 见 Hubbard[1998]。 小 波 的 前 身 在 不 同 领域 中 同时 得 到 发 展 并 统一 于 Mallat[1987]。 这 篇 
文章 为 小 波 分 析 葛 定 了 数学 基础 。Meyer[1987][1990][1992a,1992b][1993] , Mallat{1987][1989a~c][1998] Ail 
Daubechies[1988][1990][1992][1993][1996] 给 出 了 小 波 的 发 展 史 。 众多 关于 小 波 的 出 版 物 激发 了 人 们 对 小 波 的 研 
究 兴 趣 。Daubechies[1992] 是 关于 小 波 数 学 理论 的 经 典 文献 。 

普通 图 像 处 理 教 材 中 都 会 介绍 小 波 在 图 像 处 理 中 的 应 用 ， 例 如 Castleman[1996] 和 许多 特定 应 用 领域 
的 书籍 与 学 报 , 包括 Rosenfeld[1984] 、Prasad and Iyengar[1997] 和 Topiwala[1998]。 近期 发 表 的 一 些 文章 可 
以 作为 深入 研究 某 些 特定 图 像 应 用 的 入 门 读物 : Gao et al.[2007] 关 于 角 点 检测 的 研究 ; Olkkonen and 
OIkkonen[2007] 关 于 网 格 实现 的 研究 ; Selesnick et al.[2005] 和 Kokare et al.[2005] 关 于 复杂 小 波 的 研究 ; 
Thévenaz and Unser[2000] 关 于 图 像 配 准 的 文章 ; Chang and Kuo[1993] 和 Unser[1995] 根 据 纹 理 进行 分 类 的 
文章 ; Heijmans and Goutsias[2000] 关 于 形态 学 小 波 的 文章 ; Banham et al.[1994]、Wang, Zhang and Pan[1995] 
和 Banham and Kastaggelos[1996] 关 于 图 像 复原 的 文章 ; Xu et al.[1994] 和 Chang, Yu and Vetterli[2000] 关 于 
图 像 增 强 的 文章 ; Delaney and Bresler[1995] 和 Westenberg and Roerdink[2000] 关 于 计算 机 断层 摄影 的 文章 ; 
Lee, Sun and Chen[1995], Liang and Kuo[1999], Wang, Lee and Toraichi[1999] 和 You and Bhattacharya [2000] 
关于 图 像 描述 和 匹配 的 文章 。 小 波 的 最 重要 应 用 之 一 是 图 像 压缩 , 例如 , 参见 Brechet et al.[2007], Demin 
Wang et al.[2006], Antonini et al.[1992], Wei et al.[1998] 和 Topiwala[1998]。 最 后 ,存在 不 少 关于 小 波 的 专 
刊 ,包括 IEEE 信息 论 学 报 [1992] (EEE Transactions of Information Theory [1992]) 的 小 波 变换 和 多 分 辩 率 信 
号 分 析 特 刊 、IEEE 信号 处 理学 报 [1993] LEEE Transactions on Signal Processing[1993]) 小 波 和 信号 处 理 特 
刊 ， 以 及 IEEE 模式 分 析 和 机 器 智能 学 报 [1989] UEEE Transactions on Pattern Analysis and Machine 
Intelligence[1989]) 多 分 辩 率 表示 特刊 。 

尽管 本 章 的 重点 是 小 波 的 基本 原理 及 其 在 图 像 处 理 中 的 应 用 ， 但 小 波 本 身 的 构建 也 很 重要 。 有 兴趣 的 读 
者 可 参阅 Battle[1987][1988]、Daubechies[1988][1992] Cohen and Daubechies[1992], Meyer{1990], Mallat{1989b], 
Unser, Aldroubi and Eden[1993] 和 Gréchenig and Madych[1992]， 它 们 并 非 所 有 文献 ， 但 可 作为 读者 深入 阅读 的 起 
点 。 读 者 还 可 参阅 一 些 关 于 子 带 编码 和 滤波 器 组 的 普通 文献 ， 如 Strang and Nguyen[1996], Vetterli and Kovacevic 
[1995]， 以 及 本 章 中 使 用 小 波 作为 例子 时 给 出 的 参考 文献 。 
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习题 
71 设计 一 个 系统 ， 对 使 用 图 7.2 (b) 中 的 编码 器 生成 的 预测 残 差 金字 塔 进行 解码 ， 并 画 出 框图 。 假 设 编 
码 器 不 会 引入 量化 误差 。 
7.2 ”为 如 下 图 像 构建 一 个 全 填充 的 近似 金字 塔 和 相应 的 预测 残 差 金字 塔 : 
14: 12-14 
15 16 17 18 
I (x, y)= 
19 ‘30 "21 “22 
23 24 25 26 


对 图 72(b) 中 的 近 供 滤波 器 使 用 2 x 2 的 块 进行 邻 域 平均 ， 并 假设 内 插 滤 波 器 实现 了 像素 复制 。 
太 7.3 ”给 定 一 幅 2x2 的 图 像 ,一 个 .+1 级 金字 塔 是 减少 还 是 扩展 了 表示 该 图 像 所 需 的 数据 量 ? 压缩 率 或 
扩展 率 是 多 少 ? 
7.4 ”包含 滤波 器 h(n)={-1/V2,1V2} > h(n)={-11V2,1V2} ，go(n)={1/V2,-1/V2} 和 gi(n)= 
{1/V2,-1/V2} 的 二 子 带子 带 编码 滤波 器 组 是 归 一 化 正 交 的 、 双 正 交 的 ?还 是 两 者 都 是 ? 
7.5 ”给 定 序列 了 (n)= {0.1, 0.25, 0.5, 1}, 其 中 n=0, 1,2,3, HE: 
(a) 符号 反 转 后 的 序列 。 
(b) 顺序 反 转 后 的 序列 。 
(c) 调制 后 的 序列 。 
(d) 调制 后 并 顺序 反 转 后 的 序列 。 
(e) 顺序 反 转 后 并 调制 后 的 序列 。 
(f) 由 (qd) 或 (e) 得 到 的 结果 与 式 (7.1-9) 一 致 吗 ? 
7.6 “计算 例 7.2 中 的 Daubechies 综合 滤波 器 go(n) 和 gi(n) 的 系数 。 令 m = 0， 使 用 式 (7.1-13) 证 明 这 些 滤 
波 器 是 归 一 化 正 交 的 。m = 1 时 ， 这 些 滤波 器 也 正 交 吗 ? 
太 7.7” 画 出 一 个 二 维 四 子 带 滤波 器 组 解码 器 ， 重 建 图 7.7 中 的 输入 fm, n)。 
7.8 给 出 =8 时 的 哈 尔 变换 矩阵 。 
fs 
7.3 


7.9 (a) 计算 2x2 图 像 的 哈 尔 变换 ; 
(b) 哈 尔 反 变 换 是 =HTTH， 其 中 了 是 三 的 哈 尔 变换 ， 万 "是 万 的 道 甜 阵 。 证 明 Hi =H], 
EHA (a) 中 结果 的 哈 尔 反 变换 。 
7.10 ”对 如 下 基 计 算 二 元 组 [1,3, ] "的 展开 系数 ， 并 写 出 对 应 的 展开 : 
(a) 在 瑟 上 ， 实 数 二 元 组 集合 的 基 m =[1/V2,1/ V2] 和 gp,=[1/V2,-1/V2] 。 
OERE, Hg, =01,0 Me, =], KEE g =[1,-1]' 和 6%%=[0,1] . 
(©) 在 RE, Me =,F, p =[-1/2,V3/2] Moe, =[-1/2,-V312] ， 及 它们 的 对 偶 B =20,/3, 
i= {0, i. Zo 
(提示 : 须 使 用 向 量 内 积 代替 7.2.1 节 中 的 内 积 。) 
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7.11 证 明 尺 度 函 数 


ae L €5<5x< 0:75 
Pe Nes She 


不 满足 多 分 辩 率 分 析 的 第 二 个 要 求 。 
7.12” 写 一 个 尺度 空间 万 的 表达 式 作为 尺度 函数 g(x) 的 一 个 函数 。 用 式 (7.2-14) 中 定义 的 哈 尔 尺度 函数 ， 
在 平移 k= {0, 1,2，3} 处 画 出 哈 尔 n REE 
x713 ”对 于 哈 尔 小 波 函 数 画 出 小 波 y, :9。 写 出 一 个 关于 哈 尔 尺 度 函 数 的 wo, zx) 的 表达 式 。 
7.14 ”假设 函数 fx) 是 哈 尔 尺度 空间 成 的 一 个 成 员 , BO) E 用。 使 用 式 (7.2-22) 将 万 表示 为 尺度 空间 Vo 
和 任何 需要 的 小 波 空间 的 一 个 函数 。 如 果 Fo 在 区 间 [0, 1) 外 为 0, 请 基于 你 的 表达 式 , 画 出 函数 了 (x) 
的 线性 展开 所 要 求 的 尺度 函数 和 小 波 函 数 。 
715 SERRE j=2, 计算 例 7.7 中 所 用 函数 的 小 波 级 数 展 开 的 前 四 项 。 将 得 到 的 展开 写 为 所 涉及 尺度 
函数 和 小 波 函 数 的 形式 。 起 始 尺 度 为 罗 =0 时 ， 得 出 的 结果 与 例 7.7 的 结果 相 比 有 何不 同 ? 
7.16 式 (7.3-5) 和 式 (7.3-6) PAY DWT 是 起 始 尺度 万 的 一 个 函数 。 
(a) 令 力 = 1( 而 不 是 0) ， 重 新 计算 例 7.8 中 函数 fn)= (1, 3,0, 了 4} 在 区 间 0 < n < 3 AiE DWT. 
(b) 使 用 (a) 的 结果 ， 根 据 变换 值 计算 /2)。 
K7A7 下 列 以 一 维 函 数 为 基础 的 连续 小 波 变换 揭示 了 什么 ? 





比例 尺 


7.18 (a) 习题 7.17 的 连续 小 波 变 换 是 由 计算 机 生成 的 。 以 它 为 基础 的 函数 首先 在 离散 区 间 中 取样 。 连 续 
变换 是 什么 ?或 者 说 它 与 函数 的 离散 小 波 变换 有 什么 区 别 ? 
k (b) 在 什么 条 件 下 选择 DWT 比 选 择 CWT 更 好 ? 当 CWT 比 DWT 好 时 ， 能 比 DWT 好 几 售 吗 ? 
#719 ” 夯 出 计算 习题 7.16 中 的 变换 所 需 的 FWT 滤波 器 组 。 使 用 适当 的 序列 标记 所 有 的 输入 和 输出 
7.20 M 点 快速 小 波 变换 的 计算 复杂 度 为 O(M)， 即 运算 次 数 与 M 成 比例 。 决定 比例 党 常数 的 因素 是 什么 ? 
7.21% (a) 如 果 输 入 到 图 7.30 (a) 中 的 三 尺度 FWT 滤波 器 组 的 是 哈 尔 尺 度 函 数 p(n)= 1,n=0,1,---, 7,0 W 
其 他 值 时 g(n) = 0。 就 哈 尔 变 换 而 论 ， 变 换 结果 是 什么 ? 
(b) 如 果 输 入 是 对 应 的 哈 尔 小 波 函数 y(n) = {1, 1, 1, 1L=1-1=1 一 1},n=0,1,…,7， 变 换 是 什么 ? 
(c) 什么 输入 序列 会 产生 变换 {0, 0, 0, B, 0, 0, 0, 0}， 并 具有 非 零 系数 W(1, 1) = B? 
4722 二 维 快速 小 波 变 换 类 似 于 7.2.1 节 中 的 金字 塔 编码 方案 。 它 们 有 哪些 相似 性 ?给 定 图 7.10(a) 中 的 三 
尺度 小 波 变 换 ， 如 何 构 造 对 应 的 近似 金字 塔 ? 该 金字 塔 有 多 少 级 ? 
7.23 “计算 习题 7.9 中 2x2 图 像 的 哈 尔 小 波 的 二 维 小 波 变换 。 画 出 所 需 的 滤波 器 组 ， 并 使 用 适当 的 阵列 标 
记 所 有 的 输入 和 输出 。 
*7.24 ”在 侍 里 叶 域 中 ， 


544 f(x—x0, Y-Y) > F(u, v)e 
i 及 平移 并 不 影响 |F(Aj| 的 显示 。 使 用 下 面 的 图 像 序列 ， 解 释 小 波 变换 的 平移 特性 。 最 左边 的 图 


-2n( yxy! M +yyo/N) 


7.25 


7.26 


7.27 
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像 在 大 小 为 644x 64 的 灰色 背景 的 中 心 位 置 ， 包 含 两 幅 大 小 为 16 x 16 的 白色 方块 。( 从 左 数 起 的 ) 第 
二 幅 图 像 是 第 一 幅 图 像 关于 哈 尔 小 波 的 单 尺度 小 波 变 换 。 第 三 幅 图 像 是 原 图 像 中 的 方块 向 右 下 方 平 
移 换 结 果 。 最 后 一 幅 图 像 (最 右边 的 图 像 ) 是 原 图 像 向 右 下 方 移动 了 1 
像素 后 的 小 波 变换 结 


如 下 图 表 显 示 了 一 个 四 尺度 快速 小 波 变换 的 哈 尔 小 波 函 数 和 尺度 函数 。 大 略 画 出 完全 三 尺度 包 分 解 
所 需要 的 附加 基 范 数 。 给 出 数学 表达 式 或 确定 这 些 函 数 的 表达 式 , 然后 根据 频率 内 容 排列 基 隔 数 并 
解释 该 结果 。 
































eel ea 
ee 
| \ L i 
mt | hi 

L 本 上 
| 74 beeen Wa | Waar | 
二 —] — i 

(lt wlr Wap A > 








图 7.1 中 花瓶 的 小 波 包 分 解 显示 如 下 : 

(a) 画 出 对 应 的 分 解 分 析 树 , 使 用 适当 的 尺度 和 小 波 空间 
名 称 标记 所 有 节点 。 

(b) 画 出 并 标记 分 解 的 频谱 。 

使 用 哈 尔 小 波 ， 确 定 函数 (n) = 0. 5, n=0, 1, 2,…，15 的 

Fo EIEEE 


ELM] = n|] 
HAS MOEN. TEES, EARHART 


记 这 些 节 点 。 









j information endless ... Abbreviation is a necessary 
reviator’s business is to make the best of a job which, 


Aldous Huxley 


图 像 压缩 是 一 种 减少 描绘 一 幅 图 像 所 需 数据 量 的 技术 和 科学 ， 它 是 数字 图 像 处 理 领域 最 有 用 、 商 
业 上 最 成 功 的 技术 之 一 。 每 天 被 压缩 和 解压 缩 的 图 像 的 数量 是 惊人 的 ， 而 压缩 和 解压 缩 本 身 对 用 户 而 
言 却 是 无 形 的。 任何 拥 有 数字 摄像 机 、 在 网 上 冲浪 或 在 DVD 上 观看 好 莱 坞 最 新 大 片 的 人 ， 都 能 从 本 
章 讨论 的 算法 和 标准 中 受益 。 

为 了 更 好 地 理解 紧凑 图 像 描 绘 的 需要 ， 考虑 使 用 720x480x24 比特 像素 阵列 来 描绘 2 小 时 的 标准 
清晰 度 (SD) 电视 电影 所 需 的 数据 量 。 数字 电影 (或 视频 ) 是 视频 帧 序列 ， 其 中 的 每 帧 都 是 一 幅 全 彩色 静 
止 图 像 。 因 为 视频 播放 必须 以 近 于 30 帧 / 秒 的 速率 连续 显示 这 些 帧 ， 所 以 必须 以 

帧 x sre 
秒 “像素 





=31 104 000 字 节 / 秒 





的 速率 访问 SD 数字 视频 数据 。2 nadie 

秒 小 时 
或 224 GB ( 千 兆 字 节 ) 的 数据 组 成 ， 需 要 27 张 8.5 GB 的 双 面 DVD (假定 传统 的 12 cm 盘 ) 来 存储 它 。 
为 了 把 2 小 时 的 电影 放 在 单 张 DVD E, 每 一 帧 必须 以 平均 26.3 的 系数 压缩 。 对 于 高 清晰 度 电 视 ， 它 
的 分 辩 率 达到 1920x1080x24 比特 /图 像 ， 其 压缩 率 应 该 更 高 。 

Web 网 页 图 像 和 高 分 辨 率 数字 摄像 机 图 片 也 要 进行 例 行 的 压缩 ， 以 节省 存储 空间 和 减少 传输 时 间 。 
例如 ， 住 宅 互 联网 连接 发 送 数据 的 速率 从 传统 电话 线路 的 56 kbps ( 千 比 特 每 秒 ) 到 宽带 的 12 Mbps ( 兆 比 
特 每 秒 ) 。 以 该 速率 范围 传输 一 幅 128x128x24 比特 全 彩色 小 图 像 需 要 的 时 间 为 7 秒 到 0.03 秒 。 压 缩 可 
以 将 传输 时 间 减 少 2~10 4%, 甚至 更 多 。 以 相同 的 方法 ，8 兆 像素 的 数字 摄像 机 在 1GB 大 小 的 闪存 
中 可 存储 的 未 压缩 全 彩色 图 像 的 数量 [ 约 41 幅 24 MB 图 像 ] 也 以 类 似 的 数量 增加 。 除了 这 些 应 用 
之 外 ,图 像 压缩 在 许多 其 他 领域 也 扮演 着 重要 的 角色 ,包括 视频 会 议 、 遥 感 、 文 本 和 医学 图 像 处 
理 、 传 真传 输 (FAX) 。 应 用 数量 的 增加 取决 于 二 值 图 像 、 灰 度 图 像 和 彩色 图 像 的 有 效 加 工 、 存储 
与 传输 。 


31104 000 x2 小 时 “<2.24x10" 字 节 








x (60°) 
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本 章 介绍 数字 图 像 压缩 的 理论 和 实践 。 我 们 将 考察 最 常用 的 压缩 技术 ， 并 描述 使 这 些 技术 更 有 用 
的 工业 标准 。 本 质 上 ， 这 些 内 容 是 介绍 性 的 ， 既 适用 于 静止 图 像 ， 也 适用 于 视频 应 用 。 最 后 介绍 数字 
图 像 水 印 处 理 ， 即 把 可 见 和 不 可 见 数据 (如 版 权 信 息 ) 揪 人 到 图 像 中 的 处 理 。 


8.1 基础 知识 


术语 数据 压缩 是 指 减 少 表示 给 定 信息 量 所 需 数据 量 的 处 理 。 在 该 定义 中 , 数据 和 信息 是 不 相同 的 ; 
数据 是 信息 传递 的 手段 。 因 为 相同 数量 的 信息 可 以 用 不 同 数量 的 数据 表示 ， 包 含 不 相关 或 重复 信息 的 
表示 称 之 为 宛 余 数据 。 若 令 b Alb’ 代表 相 同 信息 的 两 种 表示 中 的 比特 数 ( 或 信息 携带 单元 ) ， 则 用 b 比 
特 表 示 的 相对 数据 元 余 RR 是 

R=1-1/C (8.1-1) 
式 中 ，C 通常 称 为 压缩 率 ， 定 义 为 
C=b/b' (8.1-2) 
例如 , 如果 C= 10( 有 时 写成 10:1), 较 大 的 表示 有 10 比特 数据 , 那么 对 于 较 小 表示 中 的 每 1 比特 
数据 ， 较 大 表示 中 对 应 的 相对 数据 宛 余 为 0.9 (R = 0.9) ， 表 明 其 数据 的 90% 是 元 余 的 。 

在 数字 图 像 压缩 的 内 容 中 , 式 (8.1-2) 中 的 2 通常 是 以 二 维 灰 度 值 阵列 表示 一 幅 图 像 所 需 的 比特 数 。 
2.4.2 节 中 介绍 的 二 维 灰 度 阵 列 是 人 们 观察 和 解释 图 像 的 首选 格式 , 并 以 它 作 为 判定 所 有 其 他 表示 的 标 
准 。 然 而 ， 当 它 变 成 紧凑 的 图 像 表 示 时 ， 这 些 格式 就 远 不 是 最 佳 格式 。 二 维 灰 度 阵列 受 如 下 可 被 识别 
和 利用 的 三 种 主要 类 型 的 数据 元 余 的 影响 : 


1. 编码 见 余 。 编 码 是 用 于 表示 信息 实体 或 事件 集合 的 符号 系统 (字母 、 数 字 、 比 特 和 类 似 的 符号 
等 ) 。 每 个 信息 或 事件 被 赋予 一 个 编码 符号 的 序列 ， 称 之 为 码 字 。 每 个 码 字 中 的 符号 数量 就 是 
该 码 字 的 长 度 。 在 多 数 二 维 灰 度 阵列 中 ,用 于 表示 灰 度 的 8 比特 编码 所 包含 的 比特 数 ， 要 比 
表示 该 灰 度 所 需要 的 比特 数 多 。 

2. 空间 和 时 间 宛 余 。 因 为 多 数 二 维 灰 度 阵列 的 像素 是 空间 相关 的 ( 即 每 个 像素 类 似 于 或 取决 于 相 
邻 像素 ), 在 相关 像素 的 表示 中 , 信息 被 没有 必要 地 重复 。 在 视频 序列 中 , 时 间 相 关 的 像素 ( 即 
类 似 于 或 取决 于 相 邻 帧 中 的 那些 像素 ) 也 是 重复 的 信息 。 

3. 不 相关 的 信息 。 多 数 二 维 灰 度 阵 列 中 包含 有 一 些 被 人 类 视觉 系统 忽略 或 与 用 途 无 关 的 信息 。 
从 未 被 利用 的 角度 看 ， 它 是 元 余 的 。 


图 8.1(a) 到 (c) 中 由 计算 机 生成 的 图 像 显示 了 每 种 基本 宛 余 。 如 在 接 下 来 的 三 节 中 看 到 的 那样 ， 当 
一 个 或 多 个 元 余 被 减少 或 消除 时 ， 就 实现 了 压缩 。 





ve aes = abe 
图 8.1 计算 机 产生 的 256 x 256 x 8 比特 图 像 : (a) 编码 元 余 ; OSTR; CEK 
信息 (设计 的 每 幅 图 像 都 示范 了 一 种 主要 的 宛 余 , 但 其 中 也 展示 了 其 他 宛 余 ) 
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8.1.1 编码 元 余 

第 3 章 在 图 像 灰 度 值 为 随机 量 的 假设 基础 上 ， 探 讨 了 通过 直方 图 处 理 来 增强 图 像 的 技术 。 本 节 将 
利用 类 似 的 表示 方法 介绍 最 佳 信息 编码 。 É 

假设 我 们 用 区 间 [0, L-1] 内 的 一 个 离散 随机 变量 来 表示 一 幅 MxNN 图 像 的 灰 度 , 且 每 个 出 现 的 
概率 为 p.) 。 与 3.3 节 一 样 ， 


PAK) = hrs k=0, l, 2 rsd i (8.1-3) 


式 中 , 工 是 灰 度 级 数 ， mu 是 第 大 级 灰 度 在 图 像 中 出 现 的 次 数 。 如 果 用 于 表示 每 个 六 值 的 比特 数 为 r), 
则 表示 每 个 像素 所 需 的 平均 比特 数 为 


L-i 
fete 2h )p,(n) (8.1-4) 


也 就 是 说 ,给 各 个 灰 度 级 分 配 的 码 字 的 平均 长 度 ， 可 通过 对 用 于 表示 每 个 灰 度 的 比特 数 与 该 灰 度 出 现 的 
概率 的 乘积 之 和 来 得 到 。 表示 Mx 图像 所 需 的 总 比特 数 为 MNLavs。 如 果 用 自然 的 m 比特 "固定 长 度 
码 来 表示 灰 度 , 那么 式 (8.1-4) 的 右 侧 将 减少 为 m 比特 。 也 就 是 说 , 使 用 m EAE UI, Layg= mo 常数 m 
可 以 提 到 和 式 之 外 ， 只 剩 下 p, (x, ) 在 区 间 0 <k <L 内 的 和 ， 当 然 ， 该 和 为 1。 
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R81 变 长 编码 的 例子 


8 0 






















r= 87 01010111 1 
rizs=128 10000000 8 1 
riss= 186 11000100 8 
7a =255 11111111 8 

— 8 






Tk, k # 87, 128, 186, 255 








A D 自然 二 进 制 编码 是 指 对 这 种 编码 中 将 被 编码 的 每 个 事件 或 信息 (如 灰 度 值 ) 分 配 了 来 自 一 个 m 比特 二 进 制 计数 序列 的 2" 种 编码 
中 的 一 种 。 
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L(g) =1 J, ross 《图像 中 最 小 可 能 出 现 的 灰 度 〉 被 分 配 3 比特 码 字 001 [其 长 度 占 (555)=3 L 注意 , 可 分 
配给 图 8.1 (a) 中 图 像 的 灰 度 的 最 好 定 长 编码 是 自然 的 2 比特 计数 序列 {00, 01, 10, 11} ,但 得 到 的 压缩 率 仅 为 
8/2 或 4 :1 ， 比 变 长 编码 的 压缩 率 4.42 :1 少 约 10%。 


如 前 例 所 示 ， 对 事件 集合 (如 灰 度 值 ) 分 配 码 字 时 ， 若 不 取 全 部 事件 概率 的 优势 ， 就 会 出 现 编码 元 
余 。 用 自然 二 进 码 表示 一 幅 图 像 的 灰 度 时 ， 编 码 元 余 几 乎 总 是 存在 。 其 原因 是 大 多 数 图 像 都 是 由 规则 
的 、 在 某 种 程度 上 具有 可 预测 形态 (形状 ) 与 反差 的 物体 组 成 的 ， 且 这 些 图 像 被 取样 ， 所 以 描述 的 物体 
远大 于 图 像 元 素 。 对 大 多 数 图 像 来 说 , 自然 的 结果 是 某 些 灰 度 与 其 他 灰 度 相 比 更 可 能 出 现 ( 即 多 数 图 像 
的 直方 图 是 不 均匀 的 ) 。 自然 二 进 制 编码 对 最 大 和 最 小 可 能 值 分 配 相同 的 比特 数 , 因此 无 法 使 式 (8.1-4) 
最 小 ， 从 而 产生 了 编码 元 余 。 


8.1.2 ”空间 见 余 和 时 间 宛 余 
考虑 图 8.1 (b) 中 由 计算 机 生成 的 恒定 灰 度 线 的 集合 。 在 对 应 的 二 维 灰 度 阵列 中 : 


1. 所 有 256 种 灰 度 都 是 等 概率 的 。 如 图 8.2 所 示 ， 图 像 的 直方 图 是 均匀 的 。 
2， 因 为 每 条 线 的 灰 度 是 随机 选择 的 ， 在 垂直 方向 上 ， 每 条 线 的 像素 彼此 独立 。 
3. 因为 沿 每 条 线 的 像素 是 相同 的 ， 因 此 在 水 平方 向 上 它们 是 最 大 相关 的 (完全 互相 依赖 ) 。 


第 一 个 观察 告诉 我 们 ， 当 使 用 传统 的 8 比特 灰 
度 阵列 来 表示 时 ,图 8.1 (b) 中 的 图 像 不 能 单一 地 使 用 
变 长 编码 来 压缩 。 与 图 8.1(a) 《和 例 8.1) 中 的 图 像 
不 同 ， 这 些 图 像 的 直方 图 是 不 均匀 的 ， 在 这 种 情况 
下 的 一 个 定 长 8 比特 编码 可 最 小 化 式 (8.14) 。 观察 2 
和 3 揭示 了 一 个 可 被 消除 的 有 意义 的 空间 宛 余 ， 例 
如 ， 通 过 一 个 行程 长 度 对 序列 来 表示 图 8.1(a) 中 的 ° oe 
图 像 ， 其 中 每 个 行程 长 度 对 指定 一 个 新 灰 度 的 开始 i 
点 和 具有 该 灰 度 的 连续 像素 的 数量 。 基 于 行程 长 度 
的 表示 用 (256 x 256 x 8)/[(256+256) x 8] 或 128:1 的 比率 压缩 原始 的 8 比特 灰 度 图 像 。 原 始 表示 的 每 条 
256 像素 的 线 用 单一 8 比特 灰 度 值 和 行程 表示 中 的 长 度 256 来 替代 。 

在 多 数 图 像 中 ,像素 是 空间 (在 x 和 ?方向 ) 和 时 间 相关 的 ( 当 该 图 像 是 视频 序列 的 一 部 分 时 ) 。 因 
为 多 数 像素 灰 度 可 根据 相 邻 像素 灰 度 进 行 合理 的 预测 ,所 以 单个 像素 携带 的 信息 较 少 。 在 这 种 意义 上 ， 
一 个 像素 可 由 其 相 邻 像素 推断 出 来 ， 因 此 其 视觉 贡献 的 大 多 数 就 是 元 余 的 。 为 减少 空间 与 时 间 相关 像 
素 涉及 的 元 余 ， 二 维 灰 度 阵列 必须 变换 为 更 有 效 但 通常 不 可 见 的 表示 。 例 如 ,行程 长 度 或 相 邻 像素 之 
间 的 差 可 供 利 用 。 这 种 类 型 的 变换 称 为 映射 。 如 果 原 始 二 维 灰 度 阵列 的 像素 可 以 根据 变换 后 的 数据 集 
合 无 误 地 重建 ， 则 称 这 个 映射 是 可 逆 映射 ， 否 则 称 这 个 映射 是 不 可 逆 映 射 。 


8.1.3 不 相关 的 信息 


压缩 数据 集 的 最 简 方 法 之 一 是 ， 从 集合 中 消除 多 余 的 数据 。 在 数字 图 像 压缩 方面 ， 被 人 类 视 
觉 系统 忽略 的 信息 或 与 图 像 预期 的 应 用 无 关 的 信息 显然 都 是 要 删除 的 对 象 。 这 样 ， 图 8.1(c) 中 由 
计算 机 生成 的 图 像 ， 就 可 单独 由 其 平均 灰 度 (单一 的 8 比特 值 ) 来 表示 ， 因 为 它 是 以 单一 灰 度 场 的 
形式 出 现 的 。 原 始 的 256x256x8 比特 灰 度 阵列 被 减少 到 单个 字 节 ; 得 到 的 压缩 率 为 256x256x8/8 
或 65536 : 1。 当 然 , 原始 256x256x8 比特 图 像 必须 被 重建 以 供 观察 或 对 它 进行 分 析 ， maert [9 A 
的 质量 会 有 较 少 的 或 不 被 察觉 的 下 降 。 
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图 8.3 (a) 显示 了 图 8.1(c) 中 的 图 像 的 直方 图 。 注意 , 实际 存在 一 些 灰 度 值 ( 灰 度 125 到 131) ， 人 的 
视觉 系统 平均 了 这 些 灰 度 ， 并 仅 感 知 平均 值 ， 而 忽略 了 这 种 情况 下 灰 度 的 较 小 变化 。 图 8.3 (b) 是 
8.1 (c) 中 图 像 经 直方 图 均衡 处 理 后 的 结果 ， 它 使 得 灰 度 变化 可 见 ， 并 显示 了 两 个 先前 不 可 检测 的 恒 
定 灰 度 区 域 ， 一 个 是 垂直 的 ， 另 一 个 是 水 平 的 。 如 果 图 8.1 (c) 中 的 图 像 用 其 平均 灰 度 值 单独 表示 ， 这 
个 “不 可 见 的 ”结构 ( 即 两 个 恒定 灰 度 区 域 ) 及 其 周围 的 随机 灰 度 变化 (真实 信息 ) 将 会 丢失 。 这 些 信息 
是 否 保留 由 应 用 决定 。 如 果 该 信息 很 重要 ， 如 它 可 能 应 用 于 医学 (如 数字 和 射线 档案 ) 中 ， 就 不 应 该 遗 
漏 ; 否则 ， 这 种 信息 就 是 元 余 的 ， 为 确保 压缩 性 能 可 将 它 排除 在 外 。 

我 们 注意 到 ， 这 里 考察 的 宛 余 度 与 8.1.1 节 和 8.1.2 节 中 讨论 的 元 余 度 的 根本 不 同 ， 给 出 了 本 节 的 
结论 。 消除 元 余 是 可 能 的 , 因为 这 种 信息 本 身 对 于 正常 的 视觉 处 理 和 /或 期 望 的 图 像 用 途 并 不 是 本 质 的 。 
由 于 去 除 这 种 信息 会 导致 定量 信息 的 损失 ， 因 此 这 种 信息 的 去 除 通常 称 为 量化 。 这 一 术语 与 该 词 的 标 
准 用 法 一 致 ， 它 通常 意味 着 将 较 宽 范围 的 输入 值 映射 为 有 限 数 量 的 输出 值 ( 见 2.4 节 ) 。 因 为 信息 损失 
了 ， 所 以 量化 是 一 种 不 可 逆 的 操作 。 
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图 83 (a) 图 8.1(c) 中 图 像 的 直方 图 ; (b) 该 图 像 经 直方 图 均衡 处 理 后 的 形式 


8.1.4 ”图 像 信息 的 度量 


前 几 节 介绍 了 减少 用 于 表示 一 幅 图 像 的 数据 量 的 几 种 方法 。 自 然 地 ， 出 现 的 问题 是 ， 表示 一 幅 图 
像 中 的 信息 实际 上 需要 多 少 比特 ?也 就 是 说 ， 存 在 不 丢失 信息 的 充分 
描述 一 幅 图 像 的 最 小 数据 量 吗 ? 信息 论 提 供 了 回答 这 个 问题 和 相关 问 
题 的 数学 框架 。 它 的 基本 前 提 是 ,信息 的 产生 可 用 一 个 概率 过 程 建 模 ， 
该 过 程 可 以 用 一 种 与 直觉 一 致 的 方式 加 以 度量 。 根 据 这 一 推测 ,我们 可 以 说 概率 为 P(E) 的 随机 事件 5 
包含 





1 
下 (8.1-5) 
单位 的 信息 。 如 果 P(E) = 1( 即 事件 总 会 发 生 ) ， 则 7(B) =0， 并 认为 它 没有 信息 。 因 为 相关 的 该 事件 没 
有 不 确定 性 ， 所 以 在 事件 发 生 的 通信 过 程 中 不 会 传递 任何 信息 [ 如 果 P(E) = 1， 该 事件 总 会 发 生 ] 
式 (8.1-5) 中 对 数 的 底 决 定 了 度量 信息 所 用 的 单位 。 如 果 使 用 以 m 为 底 的 对 数 ， 则 这 种 度量 称 为 
m 元 单位 。 如 果 将 底 选 择 为 2， 则 信息 的 单位 是 比特 。 注 意 ， 如果 P(E)=1/2, 那么 KE)=-logs1/2 或 
1 比特 。 也 就 是 说 ， 当 两 个 出 现 概率 相等 的 事件 之 一 发 生 时 ,传达 的 信息 量 是 1 比特 。 一 -个 简单 的 例 
子 就 是 投掷 一 枚 硬币 及 其 传递 的 结果 。 
从 一 个 可 能 事件 的 离散 集合 {a, ax … , oj ， 给 定 一 个 统计 独立 随机 事件 的 信 源 ， 与 该 集合 相 联 系 
的 概率 为 {P(a1), P(a), =, Play}, WW Mata APPS AA, B 
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Pb 

H =-)° P(a;)log P(a;) (8.1-6) 
j=l 


AP, a 称 为 信 源 符号 。 因 为 它们 是 统计 独立 的 ， 所 以 信 源 本 身 称 为 零 记 忆 信 源 。 
把 一 幅 图 像 考 虑 为 一 个 虚构 零 记忆 “ 灰 度 信 源 ”的 输出 时 ， 我 们 可 通过 观察 图 像 的 直方 图 来 估计 
AURA STR. AHT, FREE UR AE 


L- 


fi = AC! log, p, (7) 
k=0 





式 中 , ZE L, ry, All p, (r) M0 8.1.1 9A 3.3 节 中 的 定义 。 因 为 使 用 以 2 为 底 的 对 数 , 式 (8.1-7) 是 以 比特 
(bit) 度量 的 虚构 灰 度 信 源 的 每 个 灰 度 输出 的 平均 信息 。 它 不 可 能 对 虚构 信 源 的 灰 度 值 以 比 志 比特 / 像 
素 少 的 码 (取样 图 像 ) 来 编码 。 
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香农 第 一 定理 


回顾 可 知 ， 例 8.1 中 的 变 长 编码 仅 用 1.81 比特 /像素 就 可 表示 图 8.1 (a) 中 图 像 的 灰 度 。 虽 然 它 
比例 8.2 中 的 估计 炉 1.6614 比特 /像素 要 高 ， 但 香农 第 一 定理 [ 也 称 为 无 噪声 编码 定理 (Shannon 
[1948]) ] 告诉 我 们 , 图 8.1 (a) 中 的 图 像 可 用 不 多 于 1.6614 MRR AN. NT AAR 
法 来 证 明 它 , 香农 使 用 单个 码 字 (而 不 是 每 个 信 源 符号 一 个 码 字 ) 考察 了 7 个 连续 信 源 符号 表示 的 
组 合 ， 并 证 明了 





in| =|- z z (8.1-8) 


BOP, Lre 是 表示 所 有 n 个 符号 组 所 需 编码 符号 的 平均 数 。 在 证 明 中 ， 他 将 一 个 零 记忆 信 源 的 第 n 
个 扩展 定义 为 一 个 假设 的 信 源 ， 该 假设 信 源 使 用 原始 信 源 符号 产生 n 个 符号 块 ， 并 将 式 (8.1-4) 
应 用 到 表示 n 个 符号 块 ? 的 码 字 来 计算 Launo BELID 告诉 我 们 ，L,,, /n 可 用 单一 符号 源 的 无 
限 扩展 编码 任意 接近 互 。 也 就 是 说 ， 用 每 信 源 符号 H 信息 单位 的 平均 来 表示 零 记忆 信 源 的 输出 
是 可 能 的 。 





D 第 nn 个 扩展 的 输出 是 一 个 元 符号 组 ,这 些 符号 来 自 底层 的 单一 符号 信 源 。 它 被 视 为 一 个 块 随机 变量 ， 在 该 变量 中 ,每 个 n 元 | 
组 的 概率 是 各 个 符号 的 概率 的 积 。 因 而 ,第 个 扩展 的 炉 ， 是 单一 符号 信 源 的 粹 的 n 倍 。 . E 
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如 果 现 在 我 们 回 到 图 像 是 产生 其 灰 度 信 源 的 一 个 “取样 ”这 一 概念 ， 那 么 n 个 信 源 符号 的 一 个 块 
对 应 于 n 个 邻近 像素 组 。 为 了 对 nn 个 像素 块 构建 一 个 变 长 编码 ， 必 须 计 算 块 的 相关 的 频数 。 但 是 ， 具 
有 256 个 灰 度 值 的 假设 的 灰 度 信 源 的 第 个 扩展 有 256" 个 可 能 的 n REI, EEE n = 2 的 简单 情况 
下 ， 也 需要 产生 65 536 个 元 素 直方 图 和 多 达 65 536 个 变 长 码 字 。 对 于 n=3， 需 要 多 达 16 777 216 个 
码 字 。 因 此 ， 即 使 对 于 较 小 的 n 值 ， 在 实践 中 ,计算 的 复杂 性 也 限制 了 扩展 编码 方法 的 使 用 价值 。 

最 后 ， 我 们 注意 到 ， 在 对 统计 独立 的 像素 直接 编码 时 ， 尽 管 式 (8.1-7) 提供 了 可 以 达到 的 压缩 的 下 
界 ， 但 当 一 幅 图 像 的 像素 相关 时 ， 它 就 会 失败 。 相 关 像素 块 可 用 比 公式 预测 的 每 像素 平均 比特 数 低 的 
码 率 编码 ,与 其 用 不 相关 描述 符 的 信 源 扩展 (类似 灰 度 行程 ) ,不 如 选择 无 扩展 的 普通 方法 。 这 是 在 8.1.2 
节 中 用 于 压缩 图 8.1 (b) 的 方法 。 当 信息 源 的 输出 依赖 于 前 面 的 有 限 数 量 的 输出 时 ， 那 么 该 信 源 就 称 为 
马尔 可 夫 信 源 或 有 限 记 忆 信 源 。 


8.1.5 RAB EN 


在 8.13 节 中 , 我 们 注意 到 去 除 “ 与 视觉 不 相关 ”的 信息 会 导致 选择 真实 的 或 一 定数 量 的 图 像 信 息 。 
因为 信息 的 丢失 ， 因 此 需要 一 种 量化 这 种 丢失 的 本 质 的 方法 。 两 类 准则 可 用 于 这 样 的 评估 : (1) 客观 保 
真 度 准则 ; (2) 主观 保 真 度 准 则 。 

当 信 息 损失 可 以 表示 为 压缩 处 理 的 输入 和 输出 的 数学 函数 时 ， 则 称 其 是 以 客观 保 真 度 准 则 为 基础 的 。 
一 个 例子 是 两 幅 图 像 间 的 均 方 根 (rms) 误 差 。 令 f(x,y) 是 输入 图 像 ， 并 令 f (x, y) FE f(x,y) 的 近似 ， 它 来 
自 对 输入 先 压 缩 后 解压 缩 的 结果 。 对 x Aly MOTEL, f(x,y) 和 了 (x,y) 之 间 的 误差 e(x,y) 为 

e(x, y)= f(x y)- f(x, y) (8.1-9) 
因此 ， 两 幅 图 像 间 的 总 误差 为 


M-1 N-1 k 
[Fe »)- Fe »)| 
x=0 y=0 
其 中 ,图 像 的 大 小 为 MxN。 而 f(x, y) 和 f(x,y) 之 间 的 均 方 根 误差 eww 是 在 Mx N 阵列 上 平均 误差 的 
平方 的 平方 根 ， 或 写 为 


M- N-I 学 


ODIE -fC »)) (8.1-10) 


MN = y=0 


如 果 [ 简单 地 重 排 式 (8.1-9) 中 的 各 项 ] 认为 A(x,y) 是 原始 图 像 A, y) 和 一 个 误差 或 “噪声 ”信号 
e(x, y) 的 和 ， 则 用 SNRw 表 示 的 输出 图 像 的 均 方 信 品 比 可 像 在 5.8 节 中 那样 定义 为 
M-11 N=-1 


Daf ae 


SNR ins = aa Aee (8.1-11) 


Dd Ife. y)— f(x, »] 


x=0 y=0 


表示 为 SNR ms 的 信 品 比 的 均 方 根 值 ， 可 通过 求 式 (8.1-11) 的 平方 根 得 到 。 
尽管 客观 保 真 度 准则 提供 了 评估 信息 损失 的 一 种 简便 方法 ， 但 解压 缩 后 的 图 像 最 终 还 是 由 人 来 
观察 的 。 因 此 ,使 用 人 的 主观 评估 来 衡量 图 像 的 质量 通常 更 为 适当 。 主 观 评估 是 通过 向 观察 者 显示 
| 解压 缩 的 图 像 ， 并 将 他 们 的 评估 结果 进行 平均 得 到 的 。 评 估 可 使 用 一 个 绝对 等 级 尺度 或 借助 于 
557| f(x,y) 和 f(x,y) 的 并 排比 较 来 获得 。 表 8.2 显 示 了 一 种 可 能 的 绝对 等 级 尺度 。 并 排比 较 可 通过 使 用 像 
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{-3, -2,-1, 0, 1,2,3} 这 样 的 一 个 等 级 分 别 表 示 主 观 评估 | 非常 恶劣 、 恶 劣 、 稍 坏 、 普 通 、 稍 好 、 更 好 、 
非常 好 |。 不 管 使 用 何 种 形式 ， 这 些 评估 均 基 于 主观 保 真 度 准 则 。 
例 8.3 ”图像 质 量 比 较 。 
”图 8.4 显示 了 图 8.1 (a) 中 图 像 的 三 种 不 同 的 近似 。 将 图 8.1 (a) 中 的 图 像 作为 f(x,y) ， 并 将 图 8.4(a) 中 
的 图 像 作为 f(x,y) ， 用 式 (8.1-10) 计 算 的 均 方 根 误差 分 别 是 5.17, 15.67 和 14.17 个 灰 度 级 。 根据 均 方 根 误 
= (客观 保 真 度 准则 )， 图 84 中 的 三 幅 图 像 按 质量 递减 的 顺序 排列 为 {(a)， (c), (b)¥. 


表 8.2 电视 配置 研究 组 织 的 等 级 尺度 (Frendendall and Behrend) 











一 幅 极 高 质量 的 图 像 ， 和 您 希望 的 一 样 好 
一 幅 高 质量 的 图 像 ， 提 供 赏心悦目 的 观看 效果 。 干扰 不 讨厌 
一 幅 质量 可 接受 的 图 像 。 干 扰 不 讨厌 

一 幅 质量 较 差 的 图 像 ， 您 希望 能 改进 它 ， 干 扰 有 些 讨厌 

一 幅 质量 非常 差 的 图 像 ， 但 还 可 以 观看 ， 明 显存 在 讨厌 的 干扰 
一 幅 坏 到 不 能 观看 的 图 像 








图 8.4 图 8.1(a) 中 图 像 的 三 个 近似 


后 被 重建 的 典型 图 像 。 两 幅 图 像 都 保留 了 原 图 像 的 基本 信息 , 如 目标 的 
根 误差 粗略 地 对 应 于 感觉 的 质量 。 实 际 上 与 原 图 像 -一样 好 的 图 8.4(a) H 
a8. ORFES, 但 在 物体 间 的 边界 处 存在 显而易见 的 退化 。 这 恰好 如 









‘As. Ae) LATHROP, 它 给 出 了 客观 保 真 度 准则 的 限制 。 注意， 在 右上 象限 中 ， 人 天 了 
条 重要 线条 的 大 部 分 ( 即 可 视 信息 )， 并 出 现 了 几 个 暗色 的 小 方块 ( 即 人 为 缺陷 ) 。 图像 的 视觉 内 容 被 误解 了 ， 

确 ， 但 它 有 着 更 小 的 均 方 根 误差 一 一 14.17 灰 度 级 对 15.67 灰 度 级 。 
表 82 对 这 三 幅 图 像 进行 主观 评估 ， 可 能 会 产生 对 图 Ga) 为 “优秀 ”的 等 级 ,对 图 人 为 “可 通过 的 ”或 
缘 的 ”的 等 级 ,对 图 (c) 是 “ 差 ”或 “不 能 用 ”的 等 级 。 另 一 方面 ， 用 均 方 根 误差 来 度量 由 gate 
的 前 面 。 


8.1.6 ”图像 讨 缩 模型 


如 图 8.5 所 示 ， 图 像 压 缩 系 统 是 由 两 个 不 同 的 功能 部 分 组 成 的 : 一 个 编码 器 和 一 个 解码 器 。 编 码 
器 执行 压缩 操作 ,解码 器 执行 解压 缩 操作 。 两 种 操作 可 用 软件 执行 ,如 在 Web 浏览 器 和 许多 商业 图 像 
编辑 程序 中 那样 ， 或 者 使 用 硬件 和 固件 相 结合 的 形式 执行 ， 如 商业 DVD 播放 器 。codec 是 一 个 具有 编 
码 和 解码 能 力 的 装置 或 程序 ， 它 有 编码 和 解码 的 能 力 。 








isd 
558 
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图 像 /(x,…) 被 输入 到 编码 器 中 ， 这 个 编码 器 创建 该 输入 的 压缩 
表示 。 把 这 一 表示 存储 起 来 以 备 后 续 应 用 ,或 为 传输 而 存储 ,以 便 远 70， Rom 
程 应 用 。 当 压缩 后 的 表示 送 入 其 互补 的 解码 器 中 时 ,就 会 产生 重建 的 
输出 图 像 (x,…) 。 在 静止 图 像 应 用 中 ， 编 码 的 输入 和 解码 器 的 输出 分 别 是 f(x,y) 和 了 (x,y) ; 在 视 
频 应 用 中 ， 它 们 分 别 是 了 (x, y, D 和 六 (x,y,t) ， 其 中 离散 参数 1 规定 为 时 间 。 通 常 ，f(x,…) 可 能 是 也 
可 能 不 是 f(x,y) 的 精确 副本 。 若 是 f(xy) 的 精确 副本 ， 则 压缩 系统 被 称 为 无 误差 的 、 无 损 的 或 信息 
保持 的 压缩 系统 ; 若 不 是 f(x,y) 的 精确 副本 ， 则 重建 的 输出 图 像 就 会 失真 ， 且 压缩 系统 称 为 有 损 压 
缩 系统 。 





f(x, y) 
或 
f(x, yt) 


fa, y) 


fand 


Se 





图 8.5 一 个 通用 图 像 压 缩 系 统 的 功能 方 框图 


编码 或 压缩 过 程 


图 8.5 中 的 编码 器 通过 一 系列 的 三 个 独立 操作 ， 去 除 8.1.1 节 至 8.1.3 节 描 述 的 元 余 形式 。 在 编码 
处 理 的 第 一 个 阶段 ， 映 射 器 把 f(x,…) 变换 为 降低 空间 和 时 间 元 余 的 形式 (通常 不 可 见 ) 。 这 一 操作 通 
常 是 可 逆 的 ， 并 且 可 能 会 也 可 能 不 会 直接 减少 表示 图 像 所 需 的 数据 量 。 衙 程 编 码 ( 见 8.1.2 WA 8.2.5 
节 ) 就 是 一 个 映射 的 例子 , 该 映射 通常 在 编码 处 理 的 第 一 步 中 就 会 得 到 压缩 。 把 一 幅 图 像 映射 为 一 组 不 
相关 的 变换 系数 ( 见 8.2.8 节 ) 是 相关 情况 的 一 个 例子 为 实现 压缩 , 必须 对 系数 进行 进一步 处 理 ) 。 在 视 
频 应 用 中 ， 了 映射 器 使 用 前 面 的 (在 某 些 将 来 的 情况 下 ) 视频 帧 来 帮助 去 除 时 间 宛 余 。 

图 8.5 中 的 量化 器 根据 预 设 的 保 真 度 准 则 降低 映射 器 输出 的 精度 , 目的 是 排除 压缩 表示 的 无 关 信 
息 。 如 8.1.3 节 中 解释 的 那样 ， 这 一 操作 不 可 逆 。 当 我 们 希望 进行 无 误差 压缩 时 ， 这 一 步 必须 略 去 。 
在 视频 应 用 中 ， 通 常 需要 度量 编码 输出 的 比特 率 (比特 / 秒 ) ， 并 调整 量化 器 的 操作 ， 以 保持 预 设 的 平 
均 输 出 比特 率 。 这 样 ， 输 出 的 视觉 质量 就 可 根据 图 像 内 容 逐 帧 变化 。 

在 第 三 阶段 ， 即 信 源 编码 处 理 的 最 后 阶段 ， 图 8.5 中 的 符号 编码 器 生成 一 个 定 长 编码 或 变 长 编码 
来 表示 量化 器 的 输出 ， 并 根据 该 编码 来 变换 输出 。 大 多 数 情况 下 会 使 用 变 长 编码 。 最 短 的 码 字 赋予 出 
现 频率 最 高 的 量化 器 输出 值 ， 以 最 小 化 编码 元 余 。 这 种 操作 是 可 逆 的 。 这 一 操作 完成 后 ， 输 入 图 像 就 
完成 了 8.1.1 节 到 8.1.3 节 中 所 描述 的 三 种 元 余 去 除 。 


解码 或 解压 缩 过 程 


图 8.5 中 的 解码 器 仅 包含 两 个 部 分 : 一 个 符号 解码 器 和 一 个 反映 射 器 。 它 们 以 相反 的 顺序 执行 编 

码 器 的 符号 编码 器 和 映射 器 的 反 操作 。 因 为 量化 导致 了 不 可 逆 的 信息 损失 ， 所 以 反 量化 器 模块 未 包含 
在 通常 的 解码 器 模型 中 。 在 视频 应 用 中 ， 解 码 后 的 输出 帧 保留 在 内 部 帧 存储 器 中 (未 显示 ) ， 以 重新 插 
pe) 入 在 编码 器 中 去 除 的 时 间 宛 余 。 
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8.1.7 图 像 格式 、 容 器 和 压缩 标准 


在 数字 图 像 处理 领 域 ， 图 像 文件 格式 是 组 织 和 存储 图 像 数据 的 标准 方法 。 它 定义 了 所 用 的 数据 排 
列 方式 和 压缩 类 型 一 一 如 果 有 的 话 。 图 像 容 器 类 似 于 文件 格式 ， 但 处 理 多 种 类 型 的 图 像 数 据 。 另 一 方 
面 , 图 像 压缩 标准 对 压缩 和 解压 缩 图 像 定 义 了 过 程 , 也 就 是 定义 减少 表示 一 幅 图 像 所 需 数据 量 的 过 程 。 
这 些 标准 是 图 像 压缩 技术 被 普遍 接受 的 基础 。 

图 8.6 列 出 了 当前 使 用 的 大 多 数 重 要 的 图 像 压缩 标准 、 文 件 格式 和 容器 ， 并 按 被 处 理 图 像 的 类 型 
进行 了 归 类 。 加 粗 的 条 目 是 由 国际 标准 化 组 织 (ISO) 、 国 际 电工 委员 会 IEC) 和 国际 电信 联盟 [ITU-T， 
一 个 联合 国 组 织 ， 从 前 称 为 国际 电报 电话 咨询 委员 会 (CCITT) | 批准 的 国际 标准 。 还 包含 两 个 视频 压 
缩 标准 ， 即 由 电影 和 电视 工程 师 协 会 (SMPTE) 批 准 的 VC-1 和 由 中 国 原 信息 产业 部 (MID 批准 的 AVS。 
注意 ， 图 8.6 中 的 灰色 条 目 不 是 国际 标准 化 组 织 支持 的 标准 。 

K 8.3 和 表 8.4 总 结 了 图 8.6 中 列 出 的 标准 、 格 式 和 容器 。 也 指出 了 负责 组 织 、 应 用 目标 和 关键 的 压缩 
方法 。 压 缩 方 法 本 身 是 下 一 节 的 主题 。 两 个 表 中 以 方 括号 的 形式 提前 引用 了 8.2 节 中 的 相关 小 节 。 

图 像 压缩 标准 、 格 式 和 容器 


静态 图 像 视频 
DV 
H.261 
二 值 连续 音调 H.262 
CCITT Group 3 JPEG H.263 
CCITT Group 4 JPEG-LS H.264 
JBIG (或 JBIG1) JPEG-2000 se 
JBIG2 x 
BMP MPEG-4 
isss GIF MPEG-4 AVC 
PDF 
PNG AVS 
TIFF HDV 
M-JPEG 
QuickTime 
VC-1 (或 WMV9) 


图 86 一 些 常 用 的 图 像 压缩 标准 、 文 件 格 式 和 容器 。 国 际 支持 的 条 目 显 示 为 黑色 ， 其 他 条 目 显示 为 灰色 
表 8.3 国际 支持 的 压缩 标准 。 方 括号 中 的 数字 指 的 是 本 章 中 的 小 节 号 
z a= 
二 值 静止 图 像 


rn a E 


CCITT 4 4 CCITT 3 组 标准 的 一 个 精简 和 革新 的 版 本 ， 仅 支持 二 维 行程 编码 


用 于 渐进 、 无 损 压缩 三 值 图 像 的 一 个 联合 二 值 图 像 专家 组 标准 。 高 达 6 比特 /像素 的 连续 色调 图 像 可 
JBIG 或 JBIG1 gout! 在 一 个 位 面 的 基础 上 编码 [8.2.7]。 使 用 了 上 下 文敏 感 的 算 未 编码 [8.23]， 且 初始 低 分 辩 率 的 图 像 版 本 


可 使 用 附加 的 压缩 数据 逐步 增强 
WA IBIG! 的 ， 针 对 桌面 、 互 联网 和 FAX 应 用 的 二 值 图 像 的 标准 ;使 用 的 压缩 方法 是 基于 内 容 的 : 
JBIG2 oa 对 文本 和 半 色调 区 域 使 用 基于 字典 的 方法 [8.2.6]， 而 对 其 他 图 像 内 容 使 用 霍 夫 曼 编码 [8.2.1] 或 算术 编 


码 [8.2.3]。 它 可 以 是 有 损 的 或 无 损 的 


连续 色调 静止 图 像 





针对 图 片 质 量 的 图 像 的 联合 图 片 专家 组 标准 。 其 有 损 基准 编码 系统 (最 通用 的 实现 ) 在 8 x 8 图 像 块 上 
[8.2.8] 用 量化 的 离散 余弦 变换 (DCT) 、 霍 夫 曼 编码 [8.2.1] 和 行程 编码 [8.2.5]。 它 是 在 互联 网 上 压缩 图 
像 的 最 普遍 的 方法 之 一 : 
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( 续 表 ) 
名 K 组 ” 织 ii R 
连续 色调 静止 图 像 
ISEC) | 针对 连续 色调 图 像 的 基于 自 适 应 预测 [8.2.9]、 上 下 文 模型 [8.2.3] 和 Golomb 编码 [8.2.2] 的 无 损 到 接近 无 
JPEG-LS 了 
ITU-T | 损 的 标准 
PO ISOAEC/ | 遵循 JPEG 的 用 于 提高 图 片 质量 图 像 的 压缩 率 的 标准 。 它 使 用 算术 编码 [8.2.3] 和 量化 离散 小 波 变换 
(DWT) [8.2.10]。 压 缩 可 以 是 有 损 的 或 无 损 的 
视频 
ee 数字 视频 。 适 用 于 家 庭 和 半 专 业 视频 制作 应 用 ， 以 及 类 似 电 子 新 闻 采 集 和 便携 式 摄像 机 等 设备 的 视 
频 标 准 。 它 使 用 一 种 类 似 于 JPEG 的 基于 DCT 的 方法 [8.2.8] 对 简单 编辑 目的 单独 地 压缩 图 像 帧 
针对 ISDN 线路 (综合 业务 数字 网 ) 的 一 种 双向 视频 会 议 标 准 。 它 分 别 支持 非 隔行 扫描 的 352x288 和 
Gan =p 176x144 分 辨 率 图 像 | 称 为 CIF (通用 中 间 格 式 ) 和 QCIF (四 分 之 一 CIF) ] 。 采 用 类 似 于 JPEG 的 基于 
å DCT 的 压缩 方法 [8.2.8], 使 用 帧 间 预 测 差 分 [8.2.9] 来 减少 时 间 宛 余 。 基于 块 的 技术 用 于 帧 间 的 运动 补 
偿 
H.262 ITU-T 见 下 面 的 MPEG-2 
en ret 针对 具有 附加 分 辨 率 SQCIF (Sub-Quarter CIF 128x96) , 4CIF (704x576) All 16CIF (1408x512) 的 普通 
i i 电话 调制 解 调 器 (如 28.8 Kb/s) WHAI H.261 的 增强 版 本 
aes E 针对 视频 会 议 、 网 络 流 和 电视 广播 的 H.261 Æ H.263 的 一 个 扩展 。 它 支持 帧 间 预 测 差分 [8.2.9] 、 可 变 
块 大 小 的 整数 变换 (不 是 DCT) 和 上 下 文 自 适应 算术 编码 [8.2.3] 
P RO 针对 CD-ROM 应 用 的 非 隔行 扫描 视频 的 速率 高 达 1.5 Mb/s 的 运动 图 像 专家 组 标准 , 它 类 似 于 HL.261， 
j 但 帧 预测 可 基于 前 一 帧 、 下 一 帧 或 两 者 的 内 插 。 几 乎 所 有 的 计算 机 和 DVD 播放 器 都 支持 该 标准 
wees A 针对 DVD 所 设计 的 传输 速率 高 达 15 Mb/s 的 MPEG-1 的 一 个 扩展 。 支持 隔行 扫描 视频 和 HDTV. 它 
是 目前 为 止 最 为 成 功 的 视频 标准 
MPEG-4 ISOMET | MPEG-2 的 一 个 扩展 ， 它 支持 可 变 块 大 小 和 帧 间 预 测 差分 [8.2.9] 
MPEG-4AVC ISO/TET | MPEG-4 的 第 10 部 分 ， 即 先进 视频 编码 (AVC) 。 与 上 面 的 HH264 AVC 相同 
表 8.4 没有 包含 在 表 8.3 中 的 常用 图 像 压 缩 标准 、 文 件 格式 和 容器 
名 称 组 ” 织 Hi R 
连续 色调 静止 图 像 
BMP Windows 位 图 。 主 要 用 做 未 压缩 的 简单 图 像 的 一 种 文件 格式 
图 形 交 换 格式 。 对 1 到 8 比特 图 像 使 用 无 损 LZW 编码 [8.2.4] 的 文件 格式 。 它 常用 于 为 万 维 网 制作 小 
ió © | 动画 和 低 分 辩 率 影片 
= Adobe | 便携 文件 格式 。 针 对 与 设备 和 分 辨 率 无 关 的 方法 表示 二 维 文档 的 一 种 格式 。 它 可 以 像 JPEG, 
Systems | JPEG-2000、CCITT 和 其 他 压缩 图 像 的 容器 来 运行 。 某 些 PDF 版 本 已 成 为 ISO 标准 
pi 万 维 网 联 | 便携 网 络 图 形 。 通 过 对 每 个 像素 值 与 基于 过 去 像素 的 预测 值 间 的 差 进行 编码 ， 是 全 透明 (高 达 48 比 
盟 (W3C) | RRR) 无 损 地 压缩 全 彩色 图 像 [8.2.9] 的 文件 标准 。 
a 标记 图 像 格 式 。 一 种 灵活 的 文件 格式 ， 支 持 多 种 图 像 压 缩 标 准 ， 包 括 JPEG, JPEG-LS. JPEG-2000, 
NS | JBIG2 和 其 他 标准 
视频 
Avs | mu | 音 视频 标准 。 类 似 于 HH264， 但 使 用 指数 Golomb 编码 [8.22]。 中 国 开发 的 标准 
th 公司 联盟 高 清晰 度 视频 。 针 对 高 清 电视 的 DV 的 一 个 扩展 ， 它 使 用 类 似 于 MPEG-2 的 压缩 ,包括 使 用 预测 差 
分 方法 [8.2.9] 去 除 时 间 宛 余 
M-JPEG 活动 了 PEG。 一 种 压缩 格式 ， 在 这 种 格式 中 ， 每 一 帧 都 独立 地 用 JPEG 来 压缩 
Quick-Time ell 支持 DV、H.261、H.262、H.264、MPEG-1、MPEG-2 和 MPEG-4 他 视频 压缩 格式 的 一 种 媒体 容器 
VC-1 | SMPTE | 互联 网 上 最 为 通用 的 视频 格式 
' 适用 于 高 清和 蓝光 高 分 辩 率 DVD 的 一 种 格式 。 它 类 似 于 H.264/AVS， 使 用 一 个 可 变 块 大 小 的 整数 
WMV9 Microsoft 
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DCT[8.2.8, 8.2.9] 和 依赖 于 上 下 文 的 变 长 码 表 [8.2.1]， 但 没有 帧 间 预 测 
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8.2 一 些 基 本 的 压缩 方法 


本 节 描 述 今天 所 用 的 几 种 主要 有 损 和 无 误差 压缩 方法 ， 主 要 介绍 那些 主流 二 值 图 像 、 连 续 色调 静 
止 图 像 和 视频 压缩 标准 中 业已 证 实 的 有 用 方法 。 标 准 本 身 用 于 对 现 有 方法 进行 示范 。 


8.2.1 BRM 


消除 编码 元 余 的 一 种 最 常用 技术 要 归功 于 和 霍 夫 曼 (Huffman [1952]) 。 参考 表 83 和 表 8A, PREAH 
单独 对 信 源 的 符号 进行 编码 时 , 霍 夫 曼 编码 对 每 个 信 源 符号 产生 最 小 数量 | 了 如 下 基本 和 
的 编码 符号 。 根 据 香农 第 一 定理 ( 见 8.1.4 节 ) ， 对 一 个 固定 值 生成 的 


@ JBIG2 
编码 是 最 佳 的 ， 但 限制 是 每 次 只 能 对 一 个 信 源 符号 进行 编码 。 在 实践 | @ JPEG 
中 , 信 源 符号 不 是 图 像 的 灰 度 ， 就 是 一 个 灰 度 映射 操作 的 输出 (如 像素 | “ MPEG 12.4 





@ H.261, H.262, H.263, H.264 


差 值 、 行 程 等 ) 。 

霍 夫 曼 方 法 的 第 一 步 是 ， 对 所 考虑 符号 的 概率 进行 排序 ， 并 把 具有 最 小 概率 的 多 个 符号 合并 为 一 
个 符号 ， 以 蔡 代 下 次 信 源 化 简 过 程 中 的 符号 ， 进 而 创建 一 个 简化 的 信 源 系列 。 图 8.7 针对 二 进 制 编码 
说 明了 这 种 处 理 ( 也 可 以 构造 开元 霍 夫 曼 编 码 ) 。 左 侧 从 上 到 下 列 出 了 一 组 虚构 的 信 源 符号 集合 及 它们 
的 概率 ( 从 大 到 小 )。 为 形成 第 一 次 信 源 简化 ， 底 部 的 两 个 概率 0.06 和 0.04 合并 ， 形 成 了 一 个 概率 值 
为 0.1 的 “复合 符号 "。 这 个 复合 符号 及 其 对 应 的 概率 被 置 于 第 一 个 信 源 简化 列 中 ,以 便 简化 后 信 源 的 
概率 仍 按 其 值 从 最 大 到 最 小 排列 。 这 个 过 程 一 直 重 复 持续 到 信 源 只 有 两 个 符号 的 简化 信 源 (在 最 右边 ) 


Alike 
原始 信 源 信 源 化 简 
1 2 3 4 
04 -04 04 -+06 
as 0.3 03 03 oaf 0.4 
a 0.1 0.1 02403 
a 0.1 oi oi. 
0.06 0.1 




















图 8.7 和 霍 夫 曼 信 源 化 简 


霍 夫 曼 编码 过 程 的 第 二 步 是 对 每 个 化 简 后 的 信 源 进行 编码 ， 从 最 小 的 信 源 开始 ， 直 到 遍历 原始 信 
Wo HR, 两 个 符号 信 源 的 最 小 长 度 的 二 值 码 是 符号 0 和 1。 如 图 8.8 所 示 , 这 些 符号 被 分 配给 最 右边 
的 两 个 符号 (这 种 分 配 是 任意 的 ; 颠倒 0 和 1 的 顺序 同样 可 行 ) 。 将 简化 信 源 中 的 两 个 符号 合并 到 其 左 
侧 ， 生 成 了 概率 为 0.6 的 简化 信 源 符号 ， 对 该 符号 编码 所 用 的 0 现在 分 配给 了 这 两 个 符号 , 而 0 和 1 
是 任意 加 到 每 个 符号 上 的， 以 便 对 它们 进行 区 分 。 然 后 ， 对 每 个 简化 信 源 重复 该 操作 ， 直 到 到 达 原 始 
信 源 。 图 8.8 最 左边 显示 了 最 终 的 编码 。 这 个 编码 的 平均 长 度 为 

Lave = (0.4)(1) + (0.3)(2) + (0.1)(3) + (0.1)(4) +(0.06)(5)+(0.04)(5)= 2.2 比特 /像素 
PARRA 2.14 比特 /符号 。 

霍 夫 曼 编码 过 程 对 一 组 符号 产生 最 佳 编码 ， 其 概率 服从 一 次 只 能 对 一 个 符号 进行 编码 的 限制 。 在 
编码 建立 之 后 ,编码 和 /或 无 误差 解码 就 简单 地 以 查找 表 的 方式 完成 。 编 码 本 身 是 一 种 瞬时 的 、 唯 一 可 
解码 的 块 编码 。 之 所 以 称 它 为 块 编码 ， 是 因为 每 个 信 源 符号 都 映射 到 了 一 个 编码 符号 的 固定 序列 中 。 
它 是 瞬时 的 ， 因 为 编码 符号 串 中 的 每 个 码 字 无 须 参 考 后续 符 号 就 可 以 进行 解码 。 它 是 唯一 可 解码 的 ， 
因为 任何 编码 符号 串 只 能 以 一 种 方式 进行 解码 。 因 此 ， 任 何 霍 夫 曼 编码 符号 串 都 可 以 通过 从 左 到 右 的 
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方式 对 该 串 中 的 每 个 符号 进行 分 析 来 解码 。 对 于 图 8.8 中 的 二 进 制 编码 ， 对 编码 串 010100111100 MÆ 
到 右 的 扫描 表明 ， 第 一 个 有 效 码 字 为 01010， 它 是 符号 a; 的 码 ; 下 一 个 有 效 编 码 是 011， 它 对 应 的 符 
号 为 a1。 按 这 种 方式 继续 下 去 ， 可 得 到 完全 解码 后 的 消息 为 waaiazaaza6s 





信 源 化 简 





0.4 1 04 1 0.4 1 0.6 0 
0.3 00 0.3 00 0.3 00 0.4 1 


011 0.1 011 0.2 010 0.3 01 
0100 0.1 0100+ ol 011 


redat T i 0101 
01011 


图 8.8 和 霍 夫 曼 编码 分 配 过 程 





例 8.4 BAS. 

图 8.9 中 的 512x512x8 a eGR 因为 灰 度 不 是 等 概率 的 ， 霍 夫 曼 
编码 过 程 的 MATLAB 实现 用 7.428 比特 /像素 对 其 编码 一 一 包括 重建 原始 8 比特 图 像 灰 度 所 要 求 的 霍 夫 竖 
编码 表 。 由 512? x(7.428 一 7.3838) 或 11 587 比 特 可 知 ， fee en [ ist (8.1-7) 48 
HGP 7.3838 比特 /像素 ] 24 0.6%. 得 到 的 压缩 率 和 对 应 的 相对 元 余 度 分 别 是 C = 8/7.428 = 1.077 和 
R=1-(1/1.077)=0.0715。 这 样 ， 原 始 8 比特 定 长 灰 度 表 示 的 7.15% 就 作为 编码 元 余 而 被 去 除 。 








图 8.9”(a) 一 幅 大 小 为 512 x 512 的 8 比特 图 像 ; (b) 该 图 像 的 直方 图 


对 大 量 符号 编码 时 ， 最 佳 霍 夫 曼 编 码 的 构造 并 不 简单 。 对 于 有 J 个 信 源 符号 的 通常 情况 ， 需 要 
J 个 符号 概率 、J 一 2 次 信 源 简化 和 J 一 2 次 编码 赋值 。 事 先 可 以 估计 信 源 符号 的 概率 时 ， 使 用 预计 算 
的 霍 夫 曼 编 码 可 以 实现 “接近 最 佳 ”编码 。 一 些 通用 的 图 像 压 缩 标准 ， 包 括 8.2.8 WA 8.2.9 节 中 讨 
论 的 JPEG 和 MPEG 标准 ， 都 规定 了 默认 的 霍 夫 曼 编码 表 ， 这 些 编码 表 是 以 实验 数据 为 基础 预先 计 
算出 来 的 。 


8.2.2 Golomb 编码 


本 节 介 绍 具有 指数 衰减 概率 分 布 输 入 的 非 负 整数 编码 。 通 过 使 用 

计算 上 比 翟 夫 曼 编码 还 要 简单 的 一 类 编码 ， 这 种 类 型 的 输入 可 被 最 佳 

化 编码 (在 香农 第 一 定理 的 意义 上 ) 。 编 码 本 身 第 一 次 是 针对 非 负 行程 

E 的 表示 提出 来 的 (Golomb[1966]) 。 在 接 下 来 的 讨论 中 ， 符 号 [x | 表示 小 于 等 于 x 的 最 大 整数 ，| x | 表 
示 大 于 等 于 x 的 最 小 整数 ,x mod y 表示 x 被 y 除 的 余数 。 
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给 定 一 个 非 负 整 数 n 和 一 个 正 整数 除数 m > 0 后， 表示 为 G,(n) HY n XF m 的 Golomb 编码 是 商 
| n/m | 的 一 元 编码 和 n mod m 的 二 进 制 表示 的 并 集 。 G, (n) 的 构建 如 下 : 


步骤 1 形成 商 | n/m | 的 一 元 编码 (整数 g 的 一 元 编码 定义 为 9 个 1 紧 跟 着 一 个 0) 。 
步骤 2 4k =[log,m],c=2'—m,r=n mod m， 并 计算 截 短 的 余数 r， 例 如 ， 使 其 满足 
> ee 比特 ， 0 <r<c 


-|r+c 截 短 至 比特， 其 他 alias 


步骤 3 连接 步骤 1 和 步骤 2 的 结果 。 


例如 ， 为 计算 G,(9) ， 可 从 求 商 | 9/4|=| 2.25 | = 2 的 一 元 编码 开始 ， 它 的 一 元 编码 是 110( 步 又 1 
的 结果 ) 。 然 后 , &k =[log,4]=2,c =2° -4=0r=9mod4 ,在 二 进 制 中 , 是 1001 mod 0100 或 0001。 
根据 式 (8.2-1) ， 是 x( 即 0001) 截 短 到 2 比特 的 结果 ， 它 是 01 (步骤 2 的 结果 ) 。 最 后 ， 连 接 来 自 步骤 1 
的 110 和 来 自 步 又 2 的 01， 得 到 11001， 即 G,(9) 。 

对 于 m= 2* ，c=0 的 特殊 情况 ， 对 所 有 n, EIR (8.2-1)F, r'=r=n mod m 截 短 至 比特 。 产 
H Golomb 编码 所 要 求 的 除法 变 成 二 进 制 移 位 操作 和 计算 上 更 简单 的 编码 , 这 种 编码 称 为 Golomb-Rice 
FAY Rice 码 (Rice[1975]) 。 表 8.5 中 的 2、3 和 4 列 列 出 了 前 10 个 非 负 整数 的 G1, G 和 Gs 码 。 因 为 在 
每 种 情况 下 m 都 是 2 HORE (Bl 1 =2° ,2=2 和 4=22)， 所 以 它们 也 是 前 三 个 Golomb-Rice 码 。 此 外 ， 
Gi 是 非 负 整数 的 一 元 码 ， 因 为 对 所 有 n， 有 | n/1|=n 和 nmod1=0。 

WIE, Golomb 码 只 能 用 于 表示 非 负 整数 , 并 且 有 许多 Golomb 码 可 供 选 择 , 其 有 效应 用 中 的 一 个 
关键 步骤 是 除数 m 的 选择 。 当 被 表示 的 整数 具有 概率 质量 函数 (PME) 的 几何 分 布 时 





P(n)=(1- p)p" (8.2-2) | ise (g.2-2) sy PMF 定义 的 离散 
' Bos 3 | : 概率 分 布 称 为 几何 概率 分 布 ， 其 对 应 
式 中 0< p<1， 可 以 证 明 Golomb 码 是 最 佳 的 ， 在 该 意义 上 ， 即 当 的 连 统 形式 是 指数 从 各。 
n= Len R | (8.2-3) 
log, (1/ p) 


IN, G, m) 为 所 有 唯一 可 判读 的 编码 提供 了 最 短 的 平均 码 长 (Gallager and Voorhis[1975]) 。 

图 8.10 画 出 了 式 (8.2-2) 在 三 个 不 同 p 值 时 的 曲线 ， 并 以 图 形 方 式 
说 明了 Golomb 编码 处 理 得 较 好 的 符号 概率 ( 即 编码 效率 ) 。 如 图 所 示 的 
那样 ， 小 整数 的 可 能 性 要 比 大 整数 大 得 多 。 

因为 一 幅 图 像 中 的 灰 度 的 概率 [ 如 图 8.9 (b) 的 直方 图 | 未必 与 式 (8.2-2) 中 规定 的 概率 和 图 8.10(a) 中 所 
示 的 概率 匹配 ,所 以 Golomb 码 很 少 用 于 灰 度 编码 。 但 对 灰 度 差 编码 时 ， 所 得 “ 差 值 ”的 概率 ( 见 8.2.9 
节 ) 一 一 值得 注意 的 是 负 差 值 这 一 例外 一 一 常常 类 似 于 式 (8.2-2) 和 图 8.10(a) 。 为 了 在 仅 能 表示 非 负 整 
数 的 Golomb 编码 中 处 理 负 差 值 ， 通 常 使 用 一 个 类 似 于 下 式 的 映射 : 

2n, n>0 

2|n| -l, n<0 

例如 ， 使 用 该 映射 ， 图 8.10(b) 中 所 示 的 双边 PMF 可 变换 为 图 8.10(c) 中 的 单 边 PMF。 整 数 被 重 
新 排序 ， 即 交换 负 整数 和 正 整 数 ， 所 以 负 整 数 可 被 映射 到 奇 正 整数 位 置 。 如 果 P(n) 是 双边 的 且 中 心 位 


M(n)= | (8.2-4) 


D 概率 质量 函数 (PMF) 定 义 一 个 离散 随机 变量 完全 等 于 某 个 值 的 概率 。PMEF 与 PDF (概率 密度 函数 ) 的 不 同 之 处 在 于 , PDF 的 值 不 
是 概率 ; MUR, PDF 在 指定 区 间 上 的 积分 才 是 概率 。 , l 
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FEAL, WA POM(n)) 将 是 单 边 的 。 然 后 ， 被 映射 的 整数 M(n) 可 以 使 用 一 种 合适 的 Golomb-Rice 码 来 
有 效 地 编码 (Weinberger et al.[1996]) 。 


表 8.5 整数 0~9 的 几 种 Golomb 码 




































N Gee(n) 
0 0 

l 10 100 

2 110 101 

3 1110 101 11000 
4 11110 1100 11001 

5 111110 1101 11010 
6 1111110 11100 11011 
7 11111110 11101 1110000 
8 111111110 111100 1110001 
9 1111111110 111101 1110010 











abe 1 ~rn 





os et 
=4 =2 


图 8.10 (a) KAZ (8.2-2) 的 三 个 单 边 的 几何 分 布 ; (b) 一 个 双边 的 指 
数 衰减 分 布 ; (c) 使 用 式 (8.2-4) 重新 对 图 (b) 重 排序 的 结果 


例 8.5 Pop ser ca 






masa 1@) 所 示 的 双 侧 分 布 。 
这 条 曲线 是 用 图 像 中 的 像素 总 数 来 由 一 化 图 8 8.3 @ 中 的 直方 四 SO 128 (效果 上 相当 
于 从 图 像 中 减 去 平均 灰 度 ) 产 生 的 = 根据 式 (8.2-4) , POM (n= p) 是 图 8.11 (b) 所 示 的 单 侧 分 布 。 如 果 使 用 表 8,5 
中 第 二 列 的 Gi 码 的 MATLAB 实现 对 重新 排序 后 的 灰 度 值 进行 Golomb 编码 ， 则 编码 后 的 表示 比 原 图 像 小 45 
a cs o- i Fe GI 码 在 理论 上 实现 4.3/5.1 或 SO iA 82 Sa 








码 进行 T Golomb 488, 那么 C= 
义 的 概率 和 E, 有 很 大 的 不 同 。 


为 结束 对 Golomb b 编码 的 讨论 ， 我 们 注意 到 ,， 表 8. 5 第 5 列 包含 的 表示 为 Ce (n) 的 第 0 阶 指数 
Golomb 码 的 前 10 个 码 。 指 数 Golomb 编码 对 于 行程 编码 很 有 用 ， 因 为 短 行程 和 长 行程 都 可 以 有 效 地 
编码 。k 阶 指数 Golomb 编码 GL, (n) 计算 如 下 : 
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步骤 1 寻找 一 个 整数 i,i > 0, 使 其 满足 


i-l i 

D 2% ene D2 (8.2-5) 
j=0 j=0 

并 形成 i 的 一 元 码 。 如 果 k=0， 则 i=| log;(n+])|， 该 编码 也 是 周知 的 Elias gamma 编码 。 


0.75 ab 


0.60 





<A, =e 2 aA TENKERNE 
n—k M(n — p) 


8.11 (a) 从 图 8.1 (c) 中 图 像 的 每 个 像素 中 减 去 平均 灰 度 后 该 图 
像 的 概率 分 布 ; (b) 对 图 (a) 使 用 式 (8.2-4) 得 到 的 映射 
步骤 2 把 二 进 制 表示 


i-l 
n- ae (8.2-6) 
j=0 


截 短 到 k+i 个 最 低 阶 比特 。 
BRS 连接 步骤 1 和 步骤 2 的 结果 。 


例如 ， 为 求 G*,(8) ， 我 们 在 步骤 1 中 令 i=| log,9 | 或 3， 因 为 k=0。 然 后 ， 式 (8.2-5) 得 到 满足 ， 
因为 
3-1 


pale << 52" 


j= j=0 
2 3 
2/<8<))2/ 
j=0 j=0 
2°42! +2 <8<2 +2 +2 +2 
7<8<15 
3 的 一 元 码 是 1110， 步 又 2 中 的 式 (8.2-6) 产生 


8-512 -8-》2/ =8-(2° +2' +27) =8-7=1=0001 
j=0 j=0 

当 截 短 至 其 3 + 0 个 最 低 阶 比特 时 ， 它 变 为 001。 连 接 步 又 1 和 步 又 2 的 结果 得 到 1110001. TER, ik 

是 n=8 时 表 8.5 中 第 4 列 的 条 目 。 最 后 ,我们 注意 到 ,类 似 于 上 一 节 的 霍 夫 曼 编码 , 表 8.5 中 的 Golomb ggg 
编码 是 变 长 的 、 瞬 时 唯一 可 解码 的 块 编码 。 


570) 
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8.2.3 ”算术 编码 


与 前 两 节 的 变 长 编码 不 同 ， 算 术 编码 生成 的 是 非 块 码 。 算 术 编 码 可 以 追溯 至 Elias 的 研究 工作 ( 见 
Abramson[1963]) ， 信 源 符号 和 码 字 之 间 不 存在 一 一 对 应 的 关系 。 相 反 ， 算 术 编 码 给 信 源 符号 (或 消 
息 ) 的 整个 序列 分 配 了 单一 的 算术 码 字 s 这 个 码 字 本 身 定义 了 一 个 介 于 0 和 1 之 间 的 实数 间隔 。 当 消 
息 中 的 符号 数量 增加 时 ， 用 于 表示 消息 的 间隔 会 变 小 ， 而 表示 该 间隔 所 需 的 信息 单位 (假设 为 比特 ) 
的 数量 则 会 变 大 。 消 息 的 每 个 符号 根据 其 出 现 的 概率 来 减 小 该 区 间 的 大 小 。 因 为 这 种 技术 不 要 求 像 
霍 夫 曼 编码 方法 那样 将 每 个 信 源 符号 转换 成 这 些 编码 符号 的 整数 ( 即 每 次 对 一 个 符号 进行 编码 ) ， 所 以 
它 ( 仅 在 理论 上 ) 达到 了 8.1.4 节 中 的 香农 第 一 定理 所 设 定 的 界限 。 

图 8.12 说 明了 算术 编码 的 基本 过 程 。 这 里 , 对 来 自 一 个 四 符号 信 源 的 五 符号 序列 或 消息 amaaa 
进行 编码 。 在 编码 处 理 的 开始 ， 假 设 消息 占据 整个 半 开 区 间 [0, 1) 。 如 表 8.6 所 示 ， 该 区 间 开 始 时 根据 
每 个 信 源 符号 出 现 的 概率 分 为 4 个 区 域 。 例 如 ， 符 号 a 与 子 区 间 [0, 0.2) 相 联 系 。 因 为 它 是 被 编码 的 消 
息 的 第 一 个 符号 ， 所 以 该 消息 间隔 开始 时 被 缩 罕 为 [0, 0.2) 。 这 样 , 在 图 8.12 中 ， 区 间 [0, 0.2) 就 被 扩展 
到 该 图 形 的 全 高 度 ， 且 其 端点 使 用 这 个 罕 区 间 的 值 来 标注 。 然 后 ， 这 个 缩 窗 的 区 间 根 据 原 始 信 源 符号 
的 概率 进行 细 分 ， 并 继续 对 下 一 个 消息 符号 进行 这 种 处 理 。 采 用 这 种 方式 ， 符 号 a, 将 该 子 区 间 变 窜 为 
[0.04, 0.08) ， 符 号 a; 进一步 将 该 子 区 间 变 罕 为 [0.056, 0.072) ， 以 此 类 推 。 必 须 保留 最 后 的 消息 符号 ， 
以 作为 特定 的 消息 结束 指示 符 ， 它 将 子 区 间 变 罕 为 [0.067 52, 0.068 8) 。 当 然 ， 在 这 个 子 区 间 内 的 任何 
数字 (如 0.068) 都 可 以 用 来 表示 该 消息 。 


0.0688 5 — 


0.06752 





图 8.12 算术 编码 过 程 


在 图 8.12 所 示 算 术 编 码 的 消息 中 ,使 用 了 3 个 十 进 制 数字 来 
表示 这 个 五 符号 消息 。 这 就 转换 为 每 信 源 符号 0.6 个 十 进 制 数字 ， 
而 由 式 (8.1-6) ， 与 之 相 比 的 信 源 的 箭 为 每 个 信 源 符号 0.58 个 十 进 
制 数字 。 当 被 编码 的 序列 的 长 度 增加 时 ， 得 到 的 算术 编码 接近 香 
农 第 一 定理 所 设 定 的 界限 。 实 际 上 ， 有 两 个 因素 会 使 得 编码 性 能 K 
无 法 达到 这 一 界限 : 0) 为 了 将 一 个 消息 与 其 他 消息 分 开 ， 增 加 了 F 
消息 结束 指示 符 ; (2) 所 用 算法 的 精度 是 有 限 的 。 算 术 编 码 的 实际 
实现 通过 引入 一 种 缩放 策略 和 一 种 舍 入 策略 解决 第 二 个 问题 (Langdon and Rissanen[1981]) 。 缩 放 策略 是 
在 根据 符号 出 现 的 概率 细 分 每 个 子 区 间 之 前 ， 把 每 个 子 区 间 重 新 归 一 化 到 区 间 [0，1) 。 舍 入 策略 则 保证 

根据 算法 的 有 限 精度 进行 截 短 ， 这 不 会 影响 被 编码 子 区 间 的 准确 表示 。 






[0.0, 02) 
[0.2, 0.4) 
[0.4, 0.8) 
[0.8, 1.0) 
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自 适应 上 下 文 相关 的 概率 估计 


使 用 精确 的 输入 符号 概率 模型 ， 即 提供 被 编码 符号 的 真实 概率 的 模型 ， 算 术 编 码 器 在 要 求 表示 被 
编码 符号 平均 码 字 符号 数 最 小 的 情形 下 是 最 佳 的 。 然 而 ， 像 霍 夫 曼 编码 和 Golomb 编码 那样 ， 不 精确 
的 概率 模型 可 导致 非 最 佳 结果 。 改 进 所 采用 概率 精确 性 的 一 种 简单 方法 是 ， 使 用 自 适应 的 、 上 下 文 相 
关 的 概率 模型 。 自 适应 概率 模型 会 像 符 号 已 被 编码 或 变 得 已 知 那样 来 更 新 符号 的 概率 。 这 样 ， 概 率 就 
会 适应 被 编码 符号 的 局 部 统计 。 上 下 文 相 关 的 模型 提供 了 概率 ， 该 概率 基于 被 编码 符号 周围 的 预定 义 
的 邻 域 像素 一 一 称 为 上 下 文 。 通 常 使 用 因果 关系 的 上 下 文 ， 即 限制 已 被 编码 的 符号 。Q 编码 器 
(Pennebaker et al.[1988]) 和 MQ 编码 器 (ISO/IEC[2000]) 两 种 周知 的 算术 编码 技术 使 用 了 自 适应 和 上 下 
文 相关 的 概率 模型 ， 它 们 已 引入 到 JBIG、JPEG-2000 和 其 他 重要 图 像 压缩 标准 中 。Q 编码 器 在 区 间 重 
新 归 一 化 期 间 动态 地 更 新 符号 概率 , 这 是 算术 编码 处 理 的 一 部 分 。Golomb 编码 中 也 使 用 了 自 适 应 上 下 
文 相关 模型 ， 例 如 ， 在 JPEG-LS 压缩 标准 中 。 








为 当前 上 下 文 更 新 概率 
| P d 
输入 e riae 概率 估计 算术 编码 编码 
符号 pean 比特 
TEX 符号 概率 

上 下 文 上 下 文 

[a 出 C{h[s[tleldlc [bla py 
正 被 编码 的 符号 正 被 编码 的 符号 正 被 编码 的 符号 





图 8.13 (a) 自 适 应 上 下 文 相关 的 算术 编码 方法 (通常 用 于 二 值 信 源 符号 ) ; (b)~(d) 三 种 可 能 的 上 下 文 模型 


图 8.13 (a) 给 出 了 二 值 信 源 符号 的 自 适应 上 下 文 相关 算术 编码 包括 的 步骤 。 当 对 二 值 符 号 编码 时 ， 
通常 使 用 算术 编码 。 当 对 每 个 符号 (或 比特 ) 开始 编码 过 程 时 , 其 上 下 文 由 图 8.13 (a) 中 的 上 下 文 决定 模 
块 形成 。 图 8.13 (b) 到 (d) 显示 了 3 种 可 被 使 用 的 上 下 文 : (1) 前 一 符号 ; (2) 前 一 组 符号 ; (3) 前 一 些 符 
号 加 上 前 一 扫描 行 上 的 符号 。 对 所 示 的 三 种 情况 ， 概 率 估计 模块 必须 管理 2 (或 2) 个 、2 (或 256) 个 
和 25 (或 32) 个 上 下 文 及 与 它们 相关 联 的 概率 。 例 如 ， 如 果 使 用 了 图 8.13 (b) 中 的 上 下 文 ， 就 必须 跟踪 传统 
Mp 0) (被 编码 符号 为 0 的 概率 给 出 了 前 一 符号 为 0) 、P(lle=0) 、Plae=1D 和 PUlae=D。 然 

后 , 将 合适 的 概率 作为 当前 上 下 文 的 函数 传 到 算术 编码 模块 ， 并 根据 图 8.12 中 说 明 的 过 程 , 产生 算术 
编码 输出 序列 。 然后 ， 更 新 包含 在 当前 编码 步骤 中 的 相关 概率 ， 以 反映 该 上 下 文中 另 一 个 符号 已 被 处 
理 的 事实 。 

最 后 ， 我 们 注意 到 许多 算术 编码 技术 受 美国 专利 的 保护 (可 能 还 受 其 他 法 律 保护 ) 。 因 为 侵害 这 些 
专利 可 能 导致 高 额 罚款 ， 包 含有 霍 夫 曼 编码 和 算术 编码 选项 的 JPEG SG een A LSE 
夫 曼 编码 。 


参考 表 8.3 和 表 8.4，LZW 编码 用 
8.2.4 LZW 编码 于 GIF, TIFF 和 PDF 文件 格式 ,但 





前 几 节 覆盖 的 技术 集中 在 消除 编码 元 余 上 。 本 节 考 虑 一 各 无误 lie ARERR 
差 压缩 图 像 中 的 空间 宛 余 的 方法 。 称 为 Lempel-Ziv-Welch (LZW) 
编码 的 这 种 技术 ， 将 定 长 码 字 分 配给 变 长 信 源 符号 序列 。 回 忆 8.1.4 节 ， 在 第 一 定理 的 证 明 中 ， 
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香农 使 用 了 信 源 符号 编码 序列 这 一 思想 ， 而 不 是 单个 信 源 符号 。LZW 编码 的 关键 特点 是 ， 它 不 


需要 被 编码 符号 出 现 的 概率 的 先 验 知识 。 尽 管 直 到 现在 这 种 压缩 技术 还 在 美国 专利 的 保护 之 下 ， 
但 LZW 压缩 技术 已 被 引入 许多 主流 图 像 文件 格式 中 , 包括 GIF, TIFF 和 PDF 等 。 创建 PNG 格 
式 得 到 了 LZW 的 许可 。 


例 8.6 图 8.9(a) 的 LZW 编码 。 . 

再 次 考虑 图 8.9(a) 中 大 小 为 512x512 的 8 比特 图 像 。 使 用 Adobe Photoshop， 该 图 像 的 未 压缩 TIFF 
版 本 要 求 286 740 字 节 的 磁盘 空间 一 一 512x512 的 8 比特 像素 加 上 24 596 字 节 的 头 文件 。 然 而 , 用 TIFF 
的 LZW 压缩 选项 得 到 的 文件 大 小 为 224 420 字 节 。 压 缩 率 是 C= 1.28。 回 忆 例 8.4 中 图 8.9 (a) 的 霍 夫 曼 编码 
表示 ，C= 1.077. H LZW 方法 实现 的 额外 压缩 是 由 于 消除 了 图 像 的 某 些 空间 宛 余 。 


LZW 编码 在 概念 上 非常 简单 (Welch[1984]) 。 在 编码 过 程 的 开始 阶段 , 先 构建 一 个 包含 被 编码 信 
源 符 号 的 码 书 或 字典 。 对 于 8 比特 单 色 图 像 ， 字 典 中 的 前 256 个 字 被 分 配给 灰 度 值 0, 1, 2，…, 255。 
当 编 码 器 顺序 地 分 析 图 像 像 素 时 , 不 在 字典 中 的 灰 度 序列 被 放置 在 算法 确定 的 位 置 ( 即 下 一 个 未 用 的 
位 置 ) 。 例 如 ， 如 果 图 像 的 前 两 个 像素 为 白色 ， 则 序列 “255-255” 可 能 被 分 配 到 256 的 位 置 ， 该 位 
置 后 面 的 地 址 保留 给 灰 度 级 0 到 255。 下 次 遇 到 两 个 连续 的 白色 像素 时 ,就 用 码 字 256( 即 包含 序列 
255-255 的 位 置 的 地 址 ) 来 表示 它们 。 如 果 在 编码 过 程 中 采用 一 个 9 比特 、512 字 的 字典 ， 则 最 初 用 
于 表示 这 两 个 像素 的 (8 + 8) 比特 被 单个 9 比特 码 字 替 代 。 很 明显 ,字典 的 大 小 是 一 个 很 重要 的 系统 
参数 。 如 果 字 典 太 小 ， 则 匹配 灰 度 级 序列 的 检测 将 变 得 不 太 可 能 ; 如 果 字 典 太 大 ， 则 码 字 的 大 小 反 
而 会 影响 压缩 性 能 。 


例 8.7 LZW 编码 。 
考虑 下 列 大 小 为 4x4 的 8 LCA GUERRA 
39 29% 1196 “126 
390 39 SG: De- 
33 29 ui NOG 3. Bi 
39 ， 40 e 126 
表 8.7 中 详细 给 出 了 对 其 16 个 像素 进行 编码 的 步 又。 假设 一 个 512 TEET 列 初始 内 容 的 字典; 





位 置 256 al: 511 开始 时 未 使 用 。 [ie 

图 像 按 从 左 到 右 、 从 上 到 下 处 理 像素 的 方法 来 进行 编码 。 每 个 连续 的 灰 度 值 与 表 8.7 中 称 之 为 “ 当 
前 可 识别 的 序列 ” 的 第 1 列 的 一 个 变量 链接 。 就 像 我 们 看 到 的 那样 ， 该 变量 最 初 为 空 。 对 每 个 链接 的 序 
列 搜 索 字 典 ， 如 果 找 到 ， 如 表 中 第 一 行 的 情况 ， 则 用 新 链接 且 可 识别 的 序列 (即位 于 字典 中 的 序列 ) 替代 
Es 这 可 在 第 2 行 的 第 1 列 中 实现 。 这 既 不 产生 输出 代码 ， 也 不 更 改 字 典 。 然 而 ， 如 果 没 有 找到 链接 的 
序列 ， 则 将 当前 可 识别 序列 的 地 址 作为 下 一 个 编码 值 输出 ， 并 将 链接 但 不 可 识别 的 序列 添加 到 字典 中 ， 
当前 可 识别 的 序列 则 初始 化 为 当前 的 像素 值 . 这 出 现在 表 中 的 第 2 行 。 最 后 两 列 详 细 给 出 了 扫描 整个 4x4 
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表 8.7 LZW 编码 示例 


正 被 处 理 的 像素 编码 后 的 输出 字典 位 置 ( 码 字 ) 
39 




















当前 可 识别 的 序列 





字典 词 条 


39 39-39 
39 39-126 
126 126-126 
126 126-39 
39 
39-39 39-39-126 
126 
126-126 126-126-39 
39 
39-39 
39-39-126 39-39-126-126 
126 
126-39 126-39-39 
39 


39-126-126 


刚刚 示范 的 LZW 编码 的 一 个 独特 的 特点 是 ， 编 码 字典 或 码 书 是 在 对 数据 进行 编码 的 同时 创建 
的 。 很 明显 , 在 LZW 解码 器 对 编码 数据 流 进行 解码 的 同时 ， 建 立 了 一 个 同样 的 解压 缩 字 典 。 作 为 练 
习 ( 见 习题 8.20) ， 请 读者 对 上 例 的 输出 进行 解码 ， 并 重建 该 码 书 。 尽 管 在 该 例 中 不 需要 ， 但 多 数 实际 
应 用 都 需要 一 种 处 理 字典 溢出 的 策略 。 一 种 简单 的 解决 办 法 是 ， 当 字典 已 满 时 ， 刷 新 或 重新 初始 化 该 
字典 ， 并 使 用 一 个 新 初始 化 后 的 字典 继续 编码 。 另 一 种 复杂 的 选择 是 ， 监 控 压 缩 性 能 ， 并 在 性 能 变 得 
低下 或 不 可 接受 时 刷新 字典 。 此 外 ， 需 要 时 ， 可 跟踪 并 替换 那些 使 用 最 少 的 字典 词 条 。 


8.2.5 ”行程 编码 


像 8.12 节 中 解释 的 那样 ， 沿 其 行 (或 列 ) 重复 灰 度 的 图 像 ， 通 常 可 ~ 

用 相同 灰 度 的 行程 表示 为 行程 对 来 压缩 ， 其 中 每 个 行程 对 指定 一 个 新 | co oe acme 
灰 度 的 开始 和 具有 该 灰 度 的 连续 像素 的 数量 。 这 种 称 为 行程 编码 的 技 | MPEG-1,2,4、BMP 和 起 他 压缩 标准 
R, 是 20 世纪 50 年 代 发 展 起 来 的 ， 目 前 连同 其 二 维 扩展 一 起 ,已 成 XMM. 

为 传真 编码 标准 的 压缩 方法 。 压 缩 是 通过 消除 空间 宛 余 的 一 种 简单 形式 ( 即 一 组 相同 的 灰 度 ) 来 实现 的 。 
当 相 同 像素 的 行程 较 小 (或 没有 ) 时 ， 


ae i vii = A 
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”图 8.9(a) 中 所 示 的 512x512x8 比特 图 像 的 未 压缩 BMP 文件 (使 用 Heer ae 263 244 字 节 的 
存储 空间 。 使 用 BMP 的 RLE 选项 压缩 后 ,文件 扩展 为 267 706 字 节 , TE RINER 
AiR CH 0.98, 没有 足够 的 使 得 行程 压缩 有 效 的 相等 灰 度 的 行程 ， 导致 了 BMP & 
少量 的 扩展 。 然 而 ， 对 于 图 8.1 (c) Ts dann 选项 得 到 的 压 的 TIE 文件 。 
缩 率 是 C= 1.35。 J tla od es 


压缩 二 值 图 像 时 , 行程 编码 特别 有 效 。 因为 仅 有 两 种 可 
能 的 灰 度 ( 黑 和 日 ) ， 所 以 邻近 像素 的 灰 度 更 可 能 是 相同 的 。 
另外 ,每 一 图 像 行 可 仅 用 长 度 序列 来 表示 ， 而 不 是 例 8.8 中 





表 8.8 BMP 绝对 值 编码 模式 选项 。 在 这 种 
模式 中 ，BMP 对 的 第 一 个 字 节 为 0 


所 用 的 长 度 、 灰 度 对 。 其 基本 概念 是 , 对 从 左 到 右 扫描 一 行 ” -第 -个 字 # 信 | 条 ft 
时 所 遇 到 的 1 或 0 的 每 个 连续 组 , 使 用 这 些 连续 组 的 长 度 进 a 

行 编码 ， 并 且 建 立 决定 行程 值 的 约定 。 最 通常 的 约定 是 ; E BAA ra 
(1) 指定 每 行 的 第 一 个 行程 的 值 ， 或 (2) 假设 每 行 从 一 个 白 EE e ien 





色 行 程 开始 ， 其 行程 事实 上 可 能 是 零 。 

尽管 行程 编码 本 身 是 一 种 压缩 二 值 图 像 的 有 效 方法 ， 但 对 行程 本 身 进 行 变 长 编码 可 以 实现 额外 的 
压缩 。 黑 和 白 行 程 可 个 别 地 进行 编码 ， 这 些 变 长 编码 是 根据 它们 自身 的 特殊 统计 数据 制定 的 。 例 如 ， 
令 符号 ga 表示 一 个 长 度 为 j 的 黑色 行程 ， 我们 可 以 估计 由 一 个 假想 的 黑色 行程 长 度 信 源 发 出 的 符号 a 
的 概率 ， 它 等 于 整个 图 像 中 长 度 为 7 的 黑色 行程 数 除 以 黑色 行程 总 数 。 这 个 黑色 行程 信 源 的 焙 的 估计 
表示 为 HB， 然 后， 将 这 些 概率 代入 式 (8.1-6)。 对 于 白色 行程 的 炉 ， 可 得 出 类 似 的 结论 ， 表 示 为 Hio 
HENRI TIERA 

He = = az (8.2-7) 

式 中 ,变量 Lo 和 石 分 别 表示 黑色 行程 和 白色 行程 的 平均 值 。 式 (8.2.7) 提 供 了 对 二 值 图 像 的 行程 使 用 变 
长 编码 时 所 要 求 的 每 像素 平均 比特 数 的 估计 。 

两 种 最 古老 且 应 用 最 广 的 二 值 图 像 压 缩 标准 是 CCITT Group 3 和 4。 虽 然 它们 已 被 用 于 各 种 计算 
机 应 用 中 , 但 它们 最 初 还 是 针对 电话 网 传输 文件 而 设计 的 传真 编码 方法 。Group 3 标准 使 用 一 维 行程 编 
码 技术 ,其 中 ,每 组 K 行 (K=2 或 4) 中 的 最 后 K1 行 可 随意 地 以 一 种 三 维 编码 方法 来 编码 。Group 4 
标准 是 Group 3 标准 的 一 种 简化 或 改进 版 本 ,该 标准 中 只 允许 进行 二 维 编码 。 两 个 标准 都 使 用 同一 种 
二 维 编码 方法 ， 从 用 前 一 行 的 信息 对 当前 行进 行 编码 的 意义 上 看 ， 这 种 方法 是 二 维 的 。 下 面 讨论 一 维 
编码 和 二 维 编码 。 

一 维 CCITT 压缩 


在 一 维 CCITT Group 3 压缩 标准 中 , 一 幅 图 像 的 每 一 行 " 被 编码 为 一 系列 变 长 霍 夫 曼 码 字 , 在 从 左 
到 右 对 该 行 的 扫描 中 ， 这 些 码 字 表 示 交 蔡 的 白色 行程 和 黑色 行程 。 采 用 的 压缩 方法 通常 称 为 改进 的 堆 
KAŽ (MP) 编码 方法 。 码 字 本 身 有 两 种 类 型 ， 在 该 标准 中 分 别称 为 终结 码 和 补偿 码 。 如 果 行 程 7 小 于 
63， 则 使 用 来 自 附录 A 的 表 A.1 中 的 终结 码 来 表示 它 。 注 意 ， 对 于 白色 行程 和 黑色 行程 ， 该 标准 规定 


7 不 同 的 终结 码 。 如 果 > 63， 则 使 用 两 种 码 一 -对 商 | /64| 使 用 补 Dp no 
偿 码 ， 而 对 + mod 64 的 余数 使 用 终结 码 。 表 A.2 中 列 出 了 补偿 码 ， 并 
HL, 这 些 补偿 码 可 能 依赖 ， 也 可 能 不 依赖 于 被 编码 的 行程 的 灰 度 ( 黑 或 

g 白 ) 。 如 果 [7164| <1792 ， 则 规定 分 隔 黑 色 行程 和 白色 行程 的 补偿 码 ， 否 则 ， 补 偿 码 是 独立 于 行程 灰 





D 在 该 标准 中 ， 图 像 称 为 页 面 ， 图 像 序列 则 称 为 文档 。 
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度 的 。 标 准 要 求 每 一 行 以 白色 行程 码 字 开始 ， 事实 上 它 可 能 是 00110101， 即 长 度 为 零 的 白色 行程 的 码 
字 。 最后, 用 一 个 唯一 的 行 的 结尾 (EOL) 码 字 000000000001 来 终止 每 一 行 ,并 对 每 幅 新 图 像 的 第 一 行 
发 出 信号。 图 像 序列 的 结尾 由 6 个 连续 的 EOL 来 指出 。 


二 维 CCITT 压缩 


CCITT Group 3 标准 和 CCITT Group 4 标准 采用 的 二 维 压缩 方法 是 逐 行 方法 ， 在 这 种 方法 中 ， 对 
每 个 黑 到 白 或 白 到 黑 的 行程 转换 的 位 置 , 根据 位 于 当前 编码 行 上 的 参考 元 素 a 的 位 置 来 编码 。 已 编码 
的 前 一 行 称 为 参考 行 ; 每 幅 新 图 像 的 第 一 行 的 参考 行 是 一 个 虚构 的 白色 行 。 所 用 的 二 维 编码 技术 称 为 
相对 元 素 地 址 指派 (READ) 编码。 在 Group 3 标准 中 ， 相 继 的 MH 编码 行 间 允许 1 个 或 3 个 READ 编 
码 行 ， 并 且 这 种 技术 称 为 改进 的 READ (MR) 编码 。 在 Group 4 标准 中 ， 人 允许 较 大 数量 的 READ 编码 
行 , 这 种 方法 称 为 改进 的 改进 的 REDA (MMR) 编码 。 如 前 面 解释 的 那样 ,从 使 用 来 自前 一 行 的 信息 对 
当前 行进 行 编码 的 意义 上 看 ， 这 种 编码 是 二 维 的 。 不 涉及 二 维 变换 。 

图 8.14 说 明了 对 单一 扫描 行 的 基本 二 维 编码 过 程 。 注 意 ， 该 过 程 的 初始 几 步 指向 几 个 关键 的 变化 
元 素 的 定位 点 处 : do, a1, dr, bi 和 bs。 标准 把 变化 元 素 定义 为 一 个 像素 ， 该 像素 的 值 不 同 于 同一 行 上 前 
一 个 像素 的 值 。 最 重要 的 变化 元 素 是 ay (参考 元 素 ) ， 它 不 是 每 个 新 编码 行 的 第 一 个 像素 左 侧 的 虚构 白 
色 变 化 元 素 所 置 的 位 置 ， 就 是 由 前 一 种 编码 模式 决定 。 编码 模式 在 下 一 段 讨 论 。ao 被 定位 后 ，ai 就 可 
标识 为 当前 编码 行 上 ao 右 侧 的 下 一 个 变化 元 素 的 位 置 , a; 可 标识 为 编码 行 上 ay 右 侧 的 下 一 个 变化 元 素 
的 位 置 , bi 可 标识 为 与 a 具有 相反 值 的 变化 元 素 , 并 在 参考 行 (或 前 一 行 ) 上 ay 的 右 侧 , bs 作为 下 一 个 
变化 元 素 可 标识 为 参考 行 上 bi 的 右 侧 。 如 果 这 些 变 化 元 素 中 的 任意 一 个 都 未 被 检测 到 ， 则 把 它们 放 到 
一 个 合适 的 行 上 最 后 一 个 像素 右 侧 的 一 个 虚构 像素 的 位 置 。 图 8.15 提供 了 各 个 变化 元 素 间 的 通常 关系 
的 两 个 说 明 。 

当前 参考 元 素 和 相关 的 变化 元 素 标识 出 来 后 ， 执 行 两 个 简单 的 测试 ， 以 便 选择 三 种 可 能 的 编码 模 
式 中 的 一 种 : 通过 模式 、 垂 直 模式 和 水 平 模式 。 初 始 测试 对 应 于 图 8.14 流程 图 的 第 一 个 分 支点 ， 比 较 
bo 和 a 的 位 置 。 第 二 个 测试 ， 对 应 于 图 8.14 中 的 第 二 个 分 支点 ， 计 算 ai 的 位 置 和 bi 的 位 置 之 间 的 距 
离 ( 以 像素 计算 ) ， 并 与 3 进行 比较 。 然 后 ， 依 照 这 些 测试 的 结果 ， 将 测试 结果 输入 到 图 8.14 中 的 对 应 
编码 框图 中 ， 并 执行 合适 的 编码 过 程 。 这 样 ， 对 于 每 个 流程 图 ， 就 建立 了 一 个 新 的 参考 元 素 ， 为 下 一 
次 编码 反复 做 好 准备 。 

表 8.9 对 三 种 可 能 的 编码 模式 定义 了 指定 用 途 的 编码 。 在 通过 模式 中 ， 特 别 排除 了 b 直接 在 a, 之 
上 的 情况 ， 仅 需要 通过 模式 码 字 0001。 如 图 8.15 (a) 所 示 ， 该 模式 可 识别 与 当前 白 或 黑 编码 行 行程 不 重 
又 的 白 或 黑 参 考 行 行程 。 在 水 平 编码 模式 中 ， 从 ao 到 a, 的 距离 和 从 a 到 a 的 距离 必须 根据 附录 A 中 
的 表 A.1 和 表 A2 的 终结 码 和 补偿 码 来 编码 ， 然 后 ， 添 加 到 水 平 模式 码 字 001 上 。 这 在 表 8.9 中 由 符 
号 001+ M(aoa) + Meia) 指 出 , 其 中 aoa 和 aa 分别 表示 从 ao 到 a 的 距离 和 从 ai 到 的 距离 。 最后， 
在 垂直 编码 模式 中 ，6 个 特殊 变 长 码 之 一 分 配给 了 al 和 bi 之 间 的 距离 。 图 8.15 (b) 说 明了 水 平 模式 和 
垂直 模式 编码 中 包含 的 参数 。 表 8.9 底部 的 扩展 模式 码 字 用 于 加 入 一 种 可 选 的 传真 编码 模式 。 例 如 ， 
0000001111 码 用 于 启动 一 种 传输 的 非 压缩 模式 。 : 


& 
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开始 新 编码 行 


在 第 一 个 
像素 前 置 m 










水 平 模式 编码 






是 
编码 行 结尾 


8.14 CCITT 二 维 READ 编码 过 程 。 符 号 wp 表示 变化 元 素 w 和 bi 间距 离 的 绝对 值 


表 8.9 CCITT 二 维 编码 表 


模 x 字 
通过 4 是 访 右 侧 的 3 个 像素 
IE ay FE bi Act) 1 个 像素 
垂直 ay Fe by EWH 2 个 像素 
atb FI a 是 bi 左 侧 的 3 个 像素 
a 是 bh 右 侧 的 1 个 像素 





a 是 bh 右 侧 的 2 个 像素 
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值 图 像 ; 如 4.5.4 节 描 述 的 那样 ， 在 打印 时 使 用 半 色 调处 理 方法 创建 了 灰色 调 的 幻影 。 如 果 图 8.16(a) 中 图 
像 的 二 值 像素 以 每 字 节 8 像素 组 的 形式 存储 ， 则 通常 称 为 文档 的 不 要 将 此 处 使 用 的 PDF (便携 文 档 
1952x2697 比特 扫描 图 像 需要 658 068 FT .该 文档 的 非 压缩 PDF 文件 (由 “| 格式) 与 前 几 节 及 前 几 章 中 表示 概率 
Photoshop 创建 ) 需 要 663 445 字 节 。 CCITT Group 3 压缩 可 将 该 文件 减少 “| 密度 函数 的 PDF N. 

到 123 497 字 节 ， 压 缩 率 为 C=5.37; Diy 110456 $75, 压缩 率 约 增加 
到 6。 
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图 8.15 CCITT (a) 通过 模式 和 (b) 垂直 与 水 平 编码 模式 编码 参数 
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图 8.16 书页 的 二 值 扫描 图 像 ，(a) 显示 整 页 内 容 的 缩小 图 像 ; (b) 在 拌 动 中 用 于 显示 二 值 像素 的 放大 图 像 


8.2.6 ”基于 符号 的 编码 
在 基于 符号 或 记号 的 编码 中 ， 图 像 被 表示 为 多 幅 频繁 发 生 的 子 图 像 的 一 个 集合 ， 称 为 符号 。 


每 个 这 样 的 符号 都 存储 在 一 个 符号 字典 中 ， 且 该 图 像 以 一 个 三 元 组 | Sek 83 和 表 8.4， 基 于 符号 的 
{(x1, yo fi), (Xz, yo be) FER RAGS, FOP, BEN (x, yy) 对 规定 了 | 编 玛 用 于 JBIG2 压缩 中 。 


图 像 中 一 个 符号 的 位 置 ， 而 记号 n 是 该 符号 或 子 图 像 在 字典 中 的 地 址 。 也 就 是 说 ， 每 个 三 元 组 表 a 
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示 图 像 中 一 个 字典 符号 的 一 个 实例 。 通 过 仅 存储 一 次 重复 的 符号 ， 可 以 有 效 地 压缩 图 像 ， 特 别 是 在 文 


档 存储 和 检索 应 用 中 ， 在 这 种 情况 下 ， 符 号 通常 是 重复 多 次 的 字符 位 图 。 

考虑 图 8.17 (a) 中 简单 的 两 级 灰 度 图 像 。 它 包含 一 个 字 banana， 该 字 由 三 个 单一 符号 a b n 组 成 : 
3 个 a、1 个 2 和 2 个 ms 假如 4b 是 在 编码 过 程 中 第 一 个 识别 的 符号 ， 其 9x7 位 图 存储 在 符号 字典 中 的 位 
置 0 内 。 如 图 8.17(b) 所 示 , 识别 b 位 图 的 记号 是 0s DORE, 在 编码 后 的 图 像 表 示 中 ， 第 一 个 三 元 组 是 (0， 
2, 0) [ 见 图 8.17(c) ]， 它 指出 表示 b 符号 的 矩形 位 图 的 左上 角 在 解码 图 像 中 被 放 在 了 位 置 (0, 2) 处 。 对 
a 和 nn 符号 的 位 图 被 识别 之 后 加 到 字典 上 ， 图 像 的 其 余部 分 可 使 用 5 个 附加 的 三 元 组 编码 。 只 要 用 于 
定位 图 像 中 的 符号 的 6 个 三 元 组 及 定义 它们 的 3 个 位 图 小 于 原 图 像 就 可 实现 压缩 。 在 这 种 情况 下 ， 起 始 图 
像 有 9x51x1 或 459 比特 ,假定 每 个 三 元 组 由 3 个 字 节 组 成 ,压缩 后 的 表示 有 (6x3x8) + [(9*7) + (6x7) + (6%6)] 
或 285 比特 ; 得 到 的 压缩 率 为 C=1.61。 为 对 图 8.17 (c) 中 基于 符号 的 表示 和 解码， 我 们 可 以 从 符号 字典 
中 读 取 以 三 元 组 形式 规定 的 符号 位 图 ， 并 将 它们 放置 到 每 个 三 元 组 指定 的 空间 坐标 处 。 

基于 符号 的 压缩 早 在 20 世纪 70 年 代 就 已 被 提出 (Ascher and Nagy[1974]) ， 但 只 是 近年 来 才 变 得 
实用 。 符号 匹配 算法 ( 见 第 12 章 ) 的 提升 和 计算 机 CPU 处 理 速度 的 提高 ， 使 得 及 时 选取 字典 符号 并 找 
到 它们 在 图 像 中 的 位 置 成 为 可 能 。 像 许多 其 他 压缩 方法 一 样 ， 基 于 符号 的 解码 远 快 于 编码 。 最 后 ,我 
们 注意 到 ， 存 储 在 字典 中 的 符号 位 图 和 用 于 参考 的 三 元 组 本 身 也 可 被 编码 ， 以 进一步 改进 压缩 性 能 。 
如 果 像 在 图 8.17 中 那样 仅 允许 精确 的 符号 匹配 ， 那 么 得 到 的 压缩 是 无 损 的 ;， 如 果 允 许 较 小 的 差别 ， 那 
么 将 出 现 一 定 程度 的 重建 误差 。 


abc 


(0, 2,0) 

(3, 10, 1) 
(3, 18, 2) 
(3, 26, 1) 





























HH 














(3, 34, 2) 
(3, 42, 1) 





图 8.17 (a) 两 其 度 级 文档 ; (b) 符号 字典 ; (©) 在 文档 中 用 于 定位 符号 的 三 元 组 
JBIG2 压缩 


JBIG2 是 一 个 针对 二 级 图 像 压 缩 的 国际 标准 。 它 通过 将 一 幅 图 像 分 割 成 正文 、 半 色调 和 普通 内 容 
的 重 倒 和 /或 不 重 倒 区 域 ， 针 对 每 种 类 型 的 内 容 采用 特定 的 最 佳 压缩 技术 : 


@ 对 于 字符 组 成 的 正文 区 域 ,基于 符号 的 编码 方法 最 适合 它们 ,每 个 符号 通常 对 应 一 个 字符 位 图 ， 
即 表 示 一 个 正文 字符 的 子 图 像 。 对 于 每 种 采用 字体 的 每 个 大 写 和 小 写字 符 , 在 符号 字典 中 通常 
仅 有 一 个 字符 位 图 (或 子 图 像 )。 例 如 ， 在 字典 中 只 有 一 个 “a” 位 图 、 一 个 “A” 位 图 、 一 个 

“b” 位 图 ， 等 等 。 
在 有 损 JBIG2 压缩 中 ( 通常 称 为 感知 无 损 或 视觉 无 损 的 JBIG2 ), 我 们 忽略 字典 位 图 ( 即 引 
用 字符 位 图 或 字符 模板 ) 和 图 像 中 相应 字符 的 特例 之 间 的 差别 。 在 无 损 压 缩 中 ， 这 一 差别 被 存 
fifi, 并 与 三 元 组 联合 对 每 个 字符 进行 编码 (由 解码 器 实现 ) ， 以 产生 实际 的 图 像 位 图 。 所 有 的 位 
图 不 是 用 算术 编码 ， 就 是 用 MMR ( 见 8.2.5 节 ) 编码 ; 用 于 访问 字典 条 目的 三 元 组 不 是 用 算术 
编码 ， 就 是 用 霍 夫 曼 编码 。 
o 半 色 调 区 域 类 似 于 正文 区 域 , 它们 由 按 规则 网 格 排 列 的 模式 组 成 。 然而, 存储 在 字典 中 的 符号 
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不 是 字符 位 图 ,而 是 表示 灰 度 的 周期 模式 ( 即 一 个 图 形 ) , 其 已 通过 抖动 来 产生 用 于 打印 的 两 灰 
@ 普通 区 域 包含 非 正文 、 非 半 色 调 信息 , 类 似 于 工艺 线条 和 噪声 , 这 种 区 域 不 是 用 算术 编码 方法 
来 压缩 ， 就 是 用 MMR 编码 方法 来 压缩 。 


如 许多 图 像 压 缩 标准 那样 , JBIG2 定义 了 解码 顺 特 性 。 它 确实 没有 明确 地 定义 一 个 标准 的 编码 融 ， 
但 其 灵活 性 足以 允许 设计 各 种 编码 器 。 昌 然 编码 顺 的 设计 处 在 未 确定 状态 ， 但 它 仍然 很 重要 ， 因 为 它 
决定 了 可 能 达到 的 压缩 水 平 。 毕 竟 ， 编 码 需 必须 把 图 像 分 割 成 多 个 区 域 ， 选 择 存储 在 字典 中 的 正文 和 
半 色 调 符号 ， 并 确定 这 些 符号 与 图 像 中 符号 潜在 的 情况 本 质 上 是 相同 还 是 不 同 。 解 码 咒 简单 地 使 用 这 
些 信息 来 重建 原 图 像 。 


例 8.11 JBIG2 压缩 实例 。 

再 次 考虑 图 8.16(a) 中 的 二 级 灰 度 图 像 。 图 8.18 (a) 显示 了 (一 个 商用 文档 压缩 应 用 ) 对 该 图 像 进 行 无 损 
JBIG2 编码 压缩 后 的 一 个 重建 部 分 。 它 是 原 图 像 的 精确 复制 。 注 意 ， 在 重建 文本 中 ，d 有 轻微 变化 ,尽管 
它们 是 由 字典 中 相同 的 4 条 目 产生 的 。d 和 图 像 中 的 d 间 的 差别 被 用 于 改善 字典 的 输出 。 为 在 编码 字典 位 
图 的 解码 期 间 实 现 这 一 改善 ,标准 定义 了 一 个 算法 。 针对 我 们 的 讨论 目的 ， 你 可 以 把 它 想象 为 将 字典 位 图 
与 图 像 中 对 应 字符 的 特定 实例 间 的 差别 加 到 从 该 字典 读 取 的 位 图 上 。 

图 8.18 (b) 是 图 8.18 (a) 中 经 感知 无 损 JBIG2 压缩 后 的 区 域 的 另 一 个 重建 。 注意 , 该 图 中 的 4 是 相同 的 。 
它们 是 直接 从 符号 字典 中 复制 的 。 称 该 重建 为 感知 无 损 的 原因 是 ,文本 是 可 读 的 ， 甚 至 字体 也 相同 。 我 们 
认为 如 图 8.18 (© 所 示 的 原 图 像 中 的 d 和 字典 中 的 d 之 间 的 小 差别 并 不 重要 ， 因 为 它们 并 不 影响 可 读 性 。 
记 住 ,我 们 处 理 的 是 二 级 灰 度 图 像 ， 故 图 8 18(c) 中 只 有 三 个 灰 度 。 灰 度 128 指出 图 8.18(a) 和 图 8.18 (b) 
中 图 像 对 应 像素 间 不 存在 差别 的 区 域 ; 灰 度 0( 黑 ) 和 灰 度 255( 白 ) 指 出 两 幅 图 像 中 相对 灰 度 的 像素 , 例如 ， 
一 幅 图 像 中 的 一 个 黑 像 素 ， 在 另 一 幅 图 像 中 是 白 像素 ， 反 之 亦 然 。 
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图 8.18 JBIG2 压缩 比较 : (a) 无 损 压 缩 与 重建 ; (b) 感知 无 损 压 缩 ;(c) 两 种 压缩 程度 的 差 值 





用 于 产生 图 8.18 (a) 的 无 损 JBIG2 压缩 ， 将 无 压缩 原 PDF 图 像 的 字 节 数 由 663 445 减少 到 32 705; E 
缩 率 为 C=20.3。 感 知 无 损 JBIG2 压缩 则 将 原 图 像 的 字 节 数 减少 到 23913 字 节 ， Trees A WT 
这 些 压缩 比 CCITT Group 3 和 CCITT Group 4 从 例 8. 10 得 到 的 结果 高 45 倍 6 


8.2.7 ”比特 平面 编码 


前 几 节 讨论 的 行程 编码 技术 和 基于 符号 的 编码 技术 ， 可 通过 单独 

处 理 图 像 的 比特 平面 的 方法 用 于 两 级 以 上 灰 度 的 图 像 。 称 为 比特 平面 | immcomoneamnn 
编码 的 这 种 技术 基于 如 下 概念 : 把 一 幅 多 级 ( 单 色 或 彩色 ) 图 像 分 解 为 
一 系列 一 值 图 像 ( 见 3.2.4 节 ) ,并 使 用 几 种 熟知 的 二 值 压缩 方法 之 一 来 压缩 每 幅 二 值 图 像 。 本 节 描述 两 
种 最 普遍 的 分 解 方法 。 
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一 幅 m 比特 单 色 图 像 的 灰 度 可 以 用 如 下 形式 的 基 2 多 项 式 来 表示 : 
Q 2) + Ay 22" ++a 2 +ay2° (8.2-8) 

基于 这 种 特性 ， 将 该 图 像 分 解 为 二 值 图 像 集 的 一 种 简单 方法 是 ， 把 该 多 项 式 的 m 个 系数 分 离 为 m 个 1 
比特 的 比特 平面 。 如 3.2.4 节 中 解释 的 那样 ; 最 低 阶 比特 平面 (对 应 最 低 阶 比特 的 平面 ) 是 通过 收集 每 个 像 
素 的 ao 比特 生成 的 ， 而 最 高 阶 比特 平面 包含 ami 比特 或 系数 。 一 般 来 讲 ， 每 个 比特 平面 都 由 给 其 像素 
置 一 个 来 自 原始 图 像 每 一 像素 的 合适 比特 值 或 多 项 式 系数 来 重建 。 这 种 分 解 方法 的 固有 缺点 是 ， 灰 度 
的 较 小 变化 会 对 比特 平面 的 复杂 性 产生 明显 影响 。 例 如 , 若 一 个 灰 度 为 127(01111111) 的 像素 与 一 个 灰 度 
为 128(10000000) 的 像素 相 邻 ， 每 个 比特 平面 将 包含 一 个 对 应 0 到 1( 或 1 到 0) 的 转换 。 壁 如 ， 因 为 127 
和 128 的 二 进 制 码 的 最 高 阶 比特 不 同 ， 所 以 最 高 比特 平面 将 包含 一 个 与 值 为 1 的 像素 相 邻 的 零 值 像素 ， 
在 该 点 产生 一 个 0 到 1 (或 1 到 0) 的 转换 。 

一 种 替代 分 解 方法 (降低 较 小 灰 度 变化 带 来 的 影响 ) 是 , 首先 用 一 个 m 比特 格雷 码 表示 图 像 。 对 应 
于 式 (8.2-8) 中 多 项 式 的 m 比特 格雷 编码 g, |… 22,8 可 由 下 式 计算 得 到 ; 


(8.2-9) 


Em- = Am- 
AH, © 表示 异 或 运算 。 这 种 编码 的 唯一 特性 是 连续 码 字 只 有 1 个 比特 位 不 同 。 因 此 ， 较 小 的 灰 度 变 
化 不 太 可 能 影响 所 有 m 个 比特 平面 。 例如， 当 灰 度 级 127 和 128 相 邻 时 ， 只 有 最 高 阶 比 特 平面 包含 有 
一 个 0 到 1 的 转换 ， 因 为 对 应 于 127 和 128 的 格雷 码 分 别 是 01000000 和 11000000。 


$8.12 比特 平面 编码 。 

图 8.19 和 图 8.20 显示 了 图 8.19 (a) 中 小 孩 的 8 比特 单 色 图 像 的 8 个 二 进 制 码 和 格雷 码 的 比特 平面 。 注 
意 , 高 阶 比特 平面 与 其 对 应 的 低 阶 比特 平面 相 比 要 简单 得 多 。 也 就 是 说 ,这些 比特 平面 中 包含 有 较 大 的 均 
名 区 域 , 其 中 的 图 像 细 节 、 杂 乱 性 或 随机 性 都 较 少 。 另外， 格雷 码 比 特 平面 比 对 应 的 二 进 制 比 特 平面 复杂 
性 要 小 。 表 8.10 中 的 JBIG2 编码 结果 反映 了 这 两 种 观察 。 注 意 ， 例 如 ，as 和 gs 的 压缩 结果 要 比 as 和 ge HE 
缩 的 结果 大 得 多 ; 而 gs 和 go 的 压缩 结果 要 比 ws 和 压缩 的 结果 小 。 这 一 倾 问 贯穿 于 表 的 始终 ， 只 有 ao 
例外 。 格 雷 编码 提供 了 平均 约 1.06:1 的 压缩 优势 。 结 合 在 一 起 ， 格 雷 编码 文件 以 678676/475864 或 1.4 :1 
的 比率 压缩 原始 的 单 色 图 像 ; 非 格雷 编码 的 文件 以 678676/$03916 或 1.35 江 的 比率 压缩 该 图 像 。 


高 有 效 二 进 制 编码 和 格雷 编码 比特 平面 


第 8 章 BAR A 361 


ee k Te cg 7 OS 
. = AA \ 司 DE a) 3 a 
ea fay s oe q > Pi ; 
vt 2 y 2 Ase 
$ $ G s ja ct È 
f Al n> ee é 
man ý in ‘tial ee ae id 
Der, VA ; 
NSG À PRA na Ñ i 
HAI } y TEN = “5 N as 
Ta sw i 。 he 
ea x ~~ wi, Stages Dies OS- RUN iu a a PAI “Fe 
a oe i 由 


图 820 (a)~(h) Æ 8.19(a) 中 图 像 的 4 个 最 低 有 效 二 进 制 编码 ( 左 列 ) 和 格雷 编码 ( 右 列 ) 比特 平面 





表 8.10 图 8.19(a) 的 二 进 制 编码 和 格雷 编码 比特 平面 的 JBIG2 无 损 编码 结果 


6999 6999 













压缩 率 
1.00 











6 12 791 11 024 1.16 
5 40 104 36 914 1.09 
4 55 911 47 415 1.18 
3 78 915 67 787 1.16 
2 101 535 92 630 1.10 
1 107 909 105 286 1.03 
0 99 753 107 909 


最 后 , 我 们 注意 到 图 8.20 中 的 两 个 最 低 阶 比特 很 少 有 明显 的 结构 s 因为 这 是 多 数 8 比特 单 色 图 像 的 典 
型 特点 ， a lai 6 Ad 原 有 的 JBIG1 到 JBIG2 都 强加 了 这 
样 的 限制 。 | 


8.2.8 块 变换 编码 


本 节 考虑 一 种 压缩 技术 ， 该 技术 把 图 像 分 成 大 小 相等 (如 8x 8) 且 不 
重 稚 的 小 块 ， 并 使 用 二 维 变换 单独 地 处 理 这 些 块 。 在 块 变 换 编码 中 ， 用 
一 种 可 道 线 性 变换 (如 健 里 叶 变 换 ) 把 每 个 块 或 子 图 像 映射 为 变换 系数 集 | H261, H262, H.263, H264、DV 和 
合 , 然后 对 这 些 变 换 系数 进行 量化 和 编码 。 对 于 大 多 数 图 像 ， 大 量 系 数 都 LDV. VO 及 基本 压缩 标准 中 。 
有 较 小 的 幅度 值 ， 并 且 可 被 粗糙 地 量化 (或 完全 抛弃 ) 而 几乎 没有 多 少 图 像 失真 。 包 括 第 4 章 介 绍 的 离散 全 
里 叶 变换 在 内 的 各 种 变换 都 可 用 于 变换 图 像 数据 。 

图 8.21 显示 了 一 个 典型 的 块 变 换 编码 系统 。 解 码 器 执行 (除了 量化 功能 外 ) 与 编码 器 相反 顺序 的 步 
又 。 编 码 器 执行 4 种 相对 简单 的 操作 : 子 图 像 分 解 、 变 换 、 量 化 和 编码 。 一 幅 大 小 为 Mx N 的 输入 图 
像 首先 被 分 解 为 大 小 为 nxn 的 子 图 像 ， 然 后 变换 这 些 子 图 像 以 生成 MN /n? 个 子 图 像 变换 阵列 ， 每 个 阵 
列 的 大 小 为 nxn。 变 换 处 理 的 目的 ， 是 对 每 幅 子 图 像 中 的 像素 进行 去 相 [OS Cw 

he = > LARI G 

关 运 算 , 或 用 最 少数 量 的 变换 系数 包含 尽 可 能 多 的 信息 。 然 后 ， 在 量化 “| ey erie. MEE, RIE 
阶段 ， 以 一 种 预定 义 的 方式 有 选择 性 地 消除 或 更 粗略 地 量化 那些 携带 最 | 设 已 对 输入 图 像 进行 了 零 填充 ， 以 便 
少 信息 的 系数 (本 节 稍 后 会 讨论 一 些 方法 ) 。 这 些 系数 对 重建 的 子 图 像 质 [INNE n NR. 


参考 表 8.3 ME 8.4， 块 变换 编码 
用 于 JPEG、M-JPEG、MPEG-1,2,4、 
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量 的 影响 最 小 。 通 过 对 量化 后 的 系数 进行 编码 (通常 使 用 变 长 编码 ) 结束 编码 过 程 。 任 何 或 所 有 变换 编 
码 步 又 都 可 以 根据 局 部 图 像 内 容 进 行 适应 性 调整 ， 这 称 为 自 适应 变换 编码 ， 而 如 果 这 些 步骤 对 所 有 子 
图 像 都 是 固定 的 ， 则 称 为 非 自 适应 变换 编码 。 


a 构建 天 小 为 
b 输入 图 像 一 =| nxn 量化 器 符号 编码 器 一 ~ 压缩 后 的 图 像 
(M XN) 的 多 幅 子 图 像 
合并 大 小 为 
weenie 一 -sawaa| Ra 上- nXn 解压 缩 后 的 图 像 
的 多 幅 图 像 


图 821 块 变换 编码 系统 ，(a) 编码 器 ，(b) 解码 器 

变换 的 选择 

人 们 已 构建 和 /或 广泛 研究 了 基于 各 种 二 维 离散 变换 的 块 变换 编码 系统 。 在 给 定 的 应 用 中 , 特定 变 
换 的 选择 取决 于 可 容 及 的 重建 误差 的 大 小 和 可 用 的 计算 资源 .压缩 是 在 对 变换 系数 的 量化 期 间 ( 而 不 是 


变换 步骤 期 间 ) 实现 的 。 ax 
参照 2.6.7 节 的 讨论 ， 考 虑 大 小 为 nxn 的 子 图 像 g(x, y)， 其 离散 变 | 图 像 /Ge 旋 的 子 图 像 。 这 样 ， 求 和 限 
换 T(wu,v) 可 表示 为 如 下 的 一 般 关 系 : MART n MAE MAIN. 


1 一 ] n-l 
T(u, v) = 28th y)r(x, y, u, V) (8.2-10) 
x=0 y=0 
式 中 , 4V= 0, l; 2, i 一 | o 给 定 T(u, v), 可 以 使 用 一 般 的 离散 反 变换 得 到 g(x, y): 


n-i n-l 


a(x, y= > J Tu, v)s(x, ys u,v) (8.2-11) 


u=0 v=0 
IF, x,y=0, 1,2,…,n 一 1。 在 这 些 公式 中 ,x(x, y, u, VAI s(x, y, u, VERA IE RRA AR EK, TE 
本 节 后 面 将 会 很 清楚 ， 它 们 也 称 为 基 函 数 或 基 图 像 。 式 (8.2-10) 中 的 Tu, v), u, v=0, 1, 2,---, 2-1 称 为 
变换 系数 ;这 些 系 数 可 视 为 g(x, VÆTIR s(x, y, u,v) 的 一 系列 展开 的 展开 系数 ( 见 7.2.1 节 ) 。 
如 2.6.7 节 说 明 的 那样 ， 如 果 
r(x, y, u, v)=H(x, ua; V) (8.2-12) 
则 式 (8.2-10) 中 的 核 是 可 分 的 ; 此 外 ， 如 果 ni 在 函数 意义 上 等 于 r»， 则 核 是 对 称 的 。 在 这 种 情况 下 ， 
式 (8.2-12) 可 表示 为 
r(x, y, u, Vv) =7H(x, WHCY, V) (8.2-13) 
如 果 式 (8.2-12) 和 式 (8.2-13) 中 的 rŒ, y, u, VH s(x, y, u, 可 代替 ， 则 对 反 变 换 核 也 有 相同 的 结论 。 按 
4.11.1 节 解 释 的 方式 ， 证 明 具 有 可 分 核 的 二 维 变换 使 用 相应 一 维 变换 的 行 - 列 或 列 - 行 操 作 来 计算 并 不 
困难 。 
式 (8.2-10) 中 的 正 变换 核 和 式 (8.2-11) 中 的 反 变 换 核 , 决定 了 所 计算 变换 的 类 型 和 总 体 计算 的 复杂 
性 ， 以 及 所 采用 块 变换 编码 系统 的 重建 误差 。 最 知名 的 一 对 变换 核 是 


r(x, y, u, v) =e Tr)/n (8.2-14) 


和 


= s(x, y, u, V) ENS (8.2-15) 
n 
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式 中 j=V-1。 它 们 是 第 2 章 中 式 (2.6-34 和 式 (2.6-35) 在 M=N=n 时 [一 一 一 一 一 
定义 的 变换 核 。 把 这 些 变换 核 代入 式 (82-10) 和 式 (8.2-11) ， 可 得 到 | VIO wav ad 
4.5.5 节 中 介绍 的 离散 传 里 叶 变换 对 的 一 种 简化 形式 。 

变换 编码 中 很 有 用 且 计算 上 较 简单 的 一 种 变换 称 为 Walsh- 
Hadamard 变换 (WHT) 。 这 种 变换 是 根据 下 列 功能 上 相同 的 核 推导 而 来 的 : 






式 (8.2-16) 中 将 n 更 改 为 N。 





m-i 
1 D5) pt)+b(y) p(y)] 
i=0 


r(x, y, u, Vv) =s(x, y, U, V) =e (8.2-16) 


式 中 n=2”。 该 式 中 的 指数 和 是 以 模 2 算术 方式 执行 的 , 而 Bx(z) 是 z 的 二 进 制 表 示 中 的 第 位 (从 右 到 
左 )。 例如， 如 果 m=3 且 z=6( 二 进 制 值 为 110) ， 则 bo(z)=0, bi(z)=1,b2(z)=1。 式 (8.2-16) 中 的 pj(w) 
使 用 下 式 计算 : 

Polu) = by, (U) 

P\(u) = bn-1 (u)+ baa (u) 

p,(u)=b,,_,(u)+,,_3(u) (8.2-17) 


Pm) = b (u) + by (u) 

如 前 面 提 到 的 那样 ， 式 中 的 求 和 是 以 模 2 算术 运算 执行 的 。 me I 
类 似 的 表达 式 可 用 于 pv). 

AMR DFT 的 核 ，DFT 的 核 是 正弦 函数 和 余弦 函数 的 和 





ic peal w 




















个 块 由 4x4= 16 个 元 素 ( 子 方块 ) 组 成 。 白 色 表示 +1 而 黑色 
表示 -1。 为 得 到 左上 角 的 块 , RITS u=v=0, 并 画 出 zy=0， 2 





[ 见 式 (8.2-14) 和 式 (8.2-15) ]，Walsh-Hadamard 核 由 棋盘 模 
式 交 替 排 列 的 +1 和 -1 组 成 。 图 8.22 显示 了 n=4 时 的 核 。 每 mn 


1, 2, 3 时 r(x, y, 0, 0) 的 值 。 在 这 种 情况 下 ,所 有 的 值 均 为 +1。 | 
顶部 行 中 的 第 二 个 块 是 (x,y, 0, IVE x y= 0, 1,2,3 时 的 值 的 。 jm = 
rr 




















图 形 , 以 此 类 推 。 正如 我 们 已 经 说 明 的 那样 ,Walsh-Hadamard 


变换 的 重要 性 在 于 它 实现 上 的 简单 性 一 一 所 有 核 的 值 均 为 +1 


Bi 图 8.22 n=4 了 时 的 Walsh-Hadamard 3 pk) 
are 数 。 每 个 块 的 原点 均 位 于 其 左上 角 


=== 





为 计算 大 小 为 NXN 的 输入 图 像 / 
(x, 而 非 一 幅 子 图 像 的 DCT， 可 图 像 压 缩 中 最 常 使 用 的 


(8.2-18) 和 式 (8.2-19) 中 将 n 更 | 恋 换 之 一 是 离散 余弦 变换 (DCT) 。 这 种 变换 是 通过 将 如 下 (相等 的 ) 核 代 
ater ASÈ (8.2-10) 和 式 (8.2-11) 中 得 到 的 : : 








r(x, y, Us v)=s(x, y, u, Vv) = a(uda(v)eos| EEDE os] C+ | (8.2-18) 
n n 


AP, 


(8.2-19) 


对 于 aE. 图 8.23 EIRT n=4 HY rx, y, u,v). 计算 遵循 图 8.22 说 明 的 相同 格式 , 不 同 之 处 是 
r 的 值 不 是 整数 。 在 图 8.23 中 ， 较 亮 的 灰 度 值 对 应 于 较 大 的 + 值 。 
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例 8.13 用 DFT、WHT 和 DCT 的 块 变换 编码 。 

图 8.24 (a) #1 (c) 显示 了 图 8.9(a) 中 大 小 为 512x512 的 单 色 图 
像 的 三 种 近似 。 这 些 图 像 是 按 如 下 方式 得 到 的 : 先 将 原 图 像 分 割 
为 大 小 为 8x8 的 子 图 像 ， 并 用 刚才 描述 的 变换 之 一 ( 即 DFT:WHT 
或 DCT 变换) 来 表示 每 幅 子 图 像 ， Pi i A 50%, 再 
对 截 尾 后 的 系数 阵列 进行 反 变 换 。 

在 每 种 情况 下 ,保留 下 来 的 32 个 系数 都 是 根据 最 大 幅 值 选择 
的 。 注 意 , 在 所 有 情况 下 , 32 个 被 丢弃 的 系数 在 重建 图 像 质 量 方 
面 几乎 没有 视觉 影响 。 然 而 ,它们 的 消除 伴随 着 一 些 均 方 根 误 
22, 这 一 点 可 在 图 8.24(d) 到 (所 示 的 误差 图 像 中 看 到 。 实 际 的 。 图 8.23 n=4 时 的 离散 余弦 基 函 数 。 每 
均 方 根 误差 分 别 是 2.32, 1.78 和 1.13 个 灰 度 级 。 个 块 的 原点 均 位 于 其 左上 角 























abe 
d © f 
图 8.24 (a) 使 用 侍 里 叶 变 换 得 到 的 图 8.9 (a) 的 近似 ; (b) 使 用 Walshi-Hadamard 变换 得 到 的 
图 8.9 (a) 的 近似 ; (c) 使 用 余弦 变换 得 到 的 图 8.9(a) 的 近似 ; (d) = 全 对 应 的 误差 图 像 
前 面 的 例子 中 提 到 的 均 方 重建 误差 的 较 小 差异 ， 直 接 与 能 量 或 所 用 变换 的 信息 包装 的 特性 有 关 。 
根据 式 (8.2-11) ， 大 小 为 nxn 的 图 像 g(x, y) 可 以 表示 为 其 二 维 变换 Tu, v) 的 函数 : 





n-i n—l 


g(x, y= > TU, v)s(x, y, u, v) (8.2-20) 


u=0 v=0 
IP, x, y=0, 1,…,2,n 一 1。 由 于 式 (8.2-20) 中 的 反 变 换 核 s, y, u,v) 仅 取决 于 参数 x, y, u,v， 而 不 取决 
于 g(x,» 或 Tlu,v) 的 值 ,所 以 该 反 变换 核 可 视 为 由 式 (8.2-20) 定义 的 序列 所 定义 的 一 组 基 函 数 或 基 图 像 。 
如 果 式 (8.2-20) 中 所 使 用 的 符号 进行 如 下 修改 ， 则 这 种 解释 会 变 得 很 清楚 : 


n=l n—l 


C=) ETH Sa (8.2-21) 
u=0 v=0 
式 中 ，G 是 一 个 包含 g(x, y) 的 像素 的 、 大 小 为 nxn 的 和 矩阵， 并且 
s(0, 0, u, v) S(O, Lu, v) =-  s(0, nel u, v) 
s(l, 0, u, v) : tee : 
a art a 2.29) 


s(n—l, 0, u, v) s(n—l,1, u, v) =- s(n—1, n—1, u, v) 
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然后 ， 包 含 输入 子 图 像 像 素 的 矩阵 G 被 明确 定义 为 大 小 为 nxn 的 到 个 矩阵 的 线性 组 合 ， 即 式 (8.2-22) 
中 的 S .u,v=0,1,2,-,n-1. 实际 上 , 这 些 和 矩阵 是 式 (8.2-20) 中 的 级 数 展开 的 基 图 像 (或 函数 ) ; 相关 
的 Tu 习 是 展开 系数 。 图 8.22 和 图 8.23 图 示 地 说 明了 n=4 时 的 WHT 和 DCT 基 图 像 。 

如 果 我 们 现在 定义 一 个 变换 系数 模板 函数 


_ 0， 车 7(wu,v) 满 足 指定 的 截 尾 准则 
X(u,v) = i 其 他 (8.2-23) 
stu, v=0,1,2,--,n-1, W) G 的 一 个 近似 可 以 根据 截 尾 后 的 展开 得 到 ; 
n—] n—l 
G= > xu, vT (u, v)S,, (8.2-24) 


u=0 v=0 


BUH, (u,v) 是 用 消除 公式 (8.2-21) 中 总 和 贡献 最 小 的 基 图 像 构建 的 。 子 图 像 G 及 其 近似 C 之 间 的 均 


方 误差 为 
nl n- 2 
£ zlle- 外 = Su 一》》 xu, VT (u, v)S,y | 
u=0 v=0 
n-l n-l 
二 | v) =y v)] 
=0 v= u=0 v=0 


YY ru, vs, [1- zm, v)] 

u=0 v=0 
RH, |@-G| EEG- HEL, orv 是 变换 位 置 (wu 要 处 系数 的 方差 。 最 终 的 化 简 是 以 基 图 像 
的 归 一 化 正 交 性 质 和 G 的 像素 是 由 零 均 值 随 机 过 程 与 已 知 协 方差 产生 的 这 一 假设 为 基础 的 。 因 此 ， 总 均 
方差 近似 误差 是 被 丢弃 的 变换 系数 的 方差 之 和 ， 即 x(u,v) =0 ， 以 便 式 (8.2-25) 中 的 [1- zx] 为 1 
的 那些 变换 系数 。 将 最 多 的 信息 重新 分 配 或 装 入 最 少 的 系数 中 的 变换 提供 最 好 的 子 图 像 近似 ， 从 而 
导致 最 小 的 重建 误差 。 最 后 , 在 导出 式 (8.2-25) 的 假设 条 件 下 , 一 幅 大 小 为 NSN 的 图 像 的 MN/mw 个 
子 图 像 的 均 方 误差 是 相同 的 。 因此 , 大 小 为 MXN 的 图 像 的 均 方 误差 (平均 误差 的 一 种 度量 ) 等 于 单个 
子 图 像 的 均 方 误差 。 

之 前 的 例子 表明 ，DCT 的 信息 携带 能 力 要 比 DFT 和 WHT 的 信息 携带 能 力 强 。 尽 管 大 多 数 图 像 
通常 都 拥有 这 一 条 件 ,但 在 信息 携带 方面 的 最 佳 变换 是 Karhunen-Loéve 变换 ( 见 第 11 章 ) 而 不 是 DCT。 
原因 是 , 对 任何 输入 图 像 和 任何 数量 的 保留 系数 ,KLT 都 可 以 使 式 (8.2-25) 的 均 方 误差 最 小 (Kramer and 
Mathews[1956])”。 然 而 ， 由 于 KLT 是 依赖 于 数据 的 ， 所 以 为 每 幅 子 图 像 得 到 KLT 基 图 像 所 需 的 计算 
任务 一 般 来 说 是 非常 繁重 的 。 由 于 这 个 原因 ， 实 际 上 很 少 使 用 KLT 来 压缩 图 像 。 相 反 ， 通常 使 用 像 
DFT, WHT 或 DCT 这 样 具有 固定 (与 输入 无 关 ) 基 图 像 的 变换 。 与 输入 无 关 的 变换 ， 非 正弦 变换 (如 
WHT 变换 ) 是 最 容易 实现 的 。 正 弦 变 换 ( 如 DFT 或 DCT) 的 信息 携带 能 力 更 接近 最 佳 KLT 的 信息 携带 
能 力 。 

因此 ， 多 数 变换 编码 系统 都 基于 DCT, DCT 在 信息 携带 能 力 和 计算 复杂 性 之 间 提 供 了 较 好 的 折 
中 。 事实 上 ，DCT 的 性 质 已 经 提供 了 DCT 成 为 变换 编码 系统 的 国际 标准 所 具有 的 实际 价值 。 与 其 他 
输入 独立 的 变换 相 比 ，DCT 变换 具有 如 下 优点 : 用 单 片 集成 电路 就 可 以 实现 ,可 将 最 多 信息 装 人 最 少 
的 系数 中 (对 大 多 数 图 像 而 言 ) , 并 且 在 子 图 像 间 的 边界 变 得 可 见 时 , 可 使 出 现 的 称 为 块 缺 陷 的 块 效 应 
最 小 化 。 与 其 他 正弦 变换 相 比 ， 最 后 一 条 性 质 尤 其 重要 。 如 图 8.25 (a) HR, DFT 隐 含 的 点 周期 性 ( 见 








(8.2-25) 














D 最 佳 的 一 个 附加 条 件 是 式 (8.2-23) 的 模板 函数 选择 具有 最 大 方差 的 KLT 系数 。 
@ Ahmed 等 人 [1974] 首 先 注意 到 一 阶 马尔 可 夫 图 像 源 的 KLT 基 图 像 与 DCT 的 基 图 像 非常 相似 。 由 于 相 邻 像素 间 的 相关 接近 1, 
所 以 输入 相关 的 KLT 基 图 像 就 变 得 与 输入 无 关 的 DCT 基 图 像 相同 (Clarke[1985]) 。 
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4.6.3 节 ) 造 成 了 导致 高 频 变换 内 容 的 边界 不 连续 性 的 上 升 。 当 DFT 变换 系数 被 截 尾 或 量化 时 ， 吉 布 斯 
现象 会 导致 边界 点 呈现 错误 的 值 ， 这 些 错误 的 值 在 图 像 中 以 块 效应 形式 出 现 。 也 就 是 说 ， 相 邻 子 图 像 
之 间 的 边界 变 得 可 见 ， 因 为 子 图 像 的 边界 像素 在 边界 点 处 呈现 为 不 连续 的 均值 [ 见 图 8.25(a) |, 图 
8.25 (b) 的 DCT 减少 了 这 种 效应 ， 因 为 这 种 变换 所 隐 含 的 2n 点 周期 性 本 质 上 不 会 产生 边界 不 连续 。 

















4 q{— 上 
18.25 (a) — DFT 中 隐 含 的 周期 性 ; (b) —4E DCT 中 隐 含 的 周期 性 
子 图 像 尺 寸 选择 


影响 变换 编码 误差 和 计算 复杂 性 的 另 一 个 重要 因素 是 子 图 像 的 尺寸 。 在 大 多 数 应 用 中 ,图 像 被 进 一 
步 细 分 ,以 便 相 邻 子 图 像 之 间 的 相关 性 (元 余 ) 降低 到 可 接受 的 程度 ,上 且 7 为 2 的 整数 次 究 , 和 前 面 一 样 ， 
n 是 子 图 像 的 维 数 。 后 一 个 条 件 简化 了 子 图 像 变 换 的 计算 COL 4.11.3 节 讨论 的 基 2 连续 加 倍 方法 ) 。 通常 ， 
压缩 水 平和 计算 复杂 性 会 随 子 图 像 尺寸 的 增加 而 增 大 。 最 常用 的 子 图 像 尺寸 为 8x8 和 16x16. 


， 例 8.14 子 图 像 尺寸 对 变换 编码 的 影响 。 ， 
图 8.26 以 图 形 方式 涪 明了 子 图 像 尺寸 对 变换 编 权 重建 
差 的 影响 。 pl ian dia Peni 








MOEA. n 进一步 增 大 时 ， ee er 
Walsh-Hadamard 曲线 而 通 近 余弦 结果 。 该 结果 与 由 Netavai 7 IS OD 
and pune isan Gees 


FABRI 
图 8.26 重建 误差 与 子 图 像 尺寸 的 关系 





BRET. (ESA, B8270 显示 了 了 原 图 像 的 局 部 放大 ， 


BE M s 
- GD 多 数 关于 电路 分 析 的 电气 工程 教材 中 都 描述 了 这 种 现象 ， 其 产生 的 原因 是 传 里 叶 变换 在 不 连续 处 无 法 一 致 收敛 。 在 不 连续 处 ， 
傅 里 叶 展 开 取 不 连续 点 的 平均 值 。 


页 
& 
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abcd 


图 8.27 (a) 使 用 25% 的 DCT 系数 对 图 8.27 (a) 的 近似 ; (b) 使 用 2x2 大 小 
的 子 图 的 近似 ; (c) 使 用 4x4 大 小 的 子 图 像 的 近似 ; (d) 使 用 8x8 
大 小 的 子 图 像 的 近似 。 图 (a) 中 的 原 图 像 是 图 8.9(a) 放大 的 局 部 


比特 分 配 


与 式 (8.2-24) 截取 后 的 级 数 展开 相关 的 重建 误差 ， 是 被 丢弃 变换 系数 的 数量 、 相 对 重要 性 及 用 于 
表示 保留 系数 的 精度 的 函数 。 在 大 多 数 变 换 编 码 系统 中 ， 保 留 的 系数 是 根据 最 大 方差 进行 选择 的 [ 即 
建立 式 (8.2-23) 的 模板 函数 ]， 这 称 为 区 域 编码 ; 或 是 根据 最 大 幅度 进行 选择 的 ， 这 称 为 阅 值 编码 。 对 
变换 后 的 子 图 像 的 系数 进行 截取 、 量 化 和 编码 的 整个 过 程 ， 通 常 称 为 比特 分 配 。 


例 8.15 比特 分 配 。 

图 8.28(a) 和 (c) 显 示 了 图 8. 9(a) 的 两 种 近似 , 在 这 两 种 近似 中 , 每 幅 8 <8 子 图 像 丢 弃 了 87.5% 的 DCT 
系数 。 第 一 幅 图 像 是 通过 保留 8 个 最 天 的 变换 系数 的 阔 值 编码 得 到 的 ， 第 二 幅 图 像 是 使 用 区 域 编码 方法 生 
成 的 。 在 后 一 种 情况 下 ， 每 个 DCT 系数 都 被 视 为 一 个 随机 变量 ， 该 随机 变量 的 分 布 可 以 通过 对 所 有 变换 
子 图 像 的 总 体 进行 计算 得 到 。8 个 最 大 方差 的 分 布 (在 变换 后 的 8 x 8 子 图 像 中 ， 占 64 个 系数 的 12.5%) BE 
定位 并 用 于 确定 为 所 有 子 图 像 保留 的 系数 Tu, vw) 的 坐标 Mvo 注意 ， 图 8.28 (b) 中 的 阔 值 编码 差 值 图 像 所 
包含 的 误差 比 图 8.28(d) 中 区 域 编码 的 误差 小 。 E 两 幅 图 像 都 已 被 放大 。 对 应 的 均 方 根 误 


差分 别 是 45 和 6.5 个 灰 度 级 。 
A7 = | abed 


图 8.28 FA8 x8 DCT 系数 的 12.5% 对 图 8.9(a) 的 近似 : (a)~(b) EJE 
编码 结果 ; (c)~(d) 区 域 编码 结果 。 放 大 4 倍 后 的 差 值 图 像 


区 域 编码 的 实现 ”区域 编 码 以 信息 论 中 观察 信息 为 不 确定 性 的 概念 为 基础 。 因 此 ， 具 有 最 大 方差 
的 变换 系数 携带 大 部 分 图 像 信息 ， 并 在 编码 处 理 中 应 该 保留 。 这 些 方 差 本 身 可 以 像 前 面 的 例子 中 那样 直 
接 根 据 MN /zz 个 变换 的 子 图 像 阵列 计算 出 来 , 或 以 一 个 假设 的 图 像 模型 为 基础 (如 一 个 马尔 可 夫 自 相关 
函数 ) 计算 出 来 。 在 任何 二 种 情况 下 ， 根 据 式 (8.2-24) ， 区 域 取样 处 理 可 被 视 为 每 个 Tu, y) 乘 以 区 域 模 板 
中 的 对 应 元 素 ， 区 域 模板 是 在 最 大 方差 的 位 置 上 设 为 1， 而 在 所 有 其 他 位 置 上 置 0 构造 出 来 的 。 最 大 方 
差 的 系数 通常 被 定位 在 图 像 变换 的 原点 的 周围 ， 所 得 到 的 典型 区 域 模板 如 图 8.29 (a) 所 示 。 

在 区 域 取样 过 程 中 保留 的 系数 必须 被 量化 和 编码 ， 以 便 区 域 模板 有 时 被 描述 成 用 于 对 每 个 系数 
进行 编码 的 比特 数 [ 见 图 8.29 (b) ]。 在 大 多 数 情况 下 ， 给 这 些 系数 分 配 相同 的 比特 数 ， 或 给 这 些 系 
数 不 均 等 地 分 配 某 些 固定 的 比特 数 。 在 第 一 种 情况 下 ， 系 数 通 常 被 它们 的 标准 差 归 一 化 并 被 均匀 量 
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化 。 在 第 二 种 情况 下 ， 为 每 个 系数 设计 一 个 量化 器 ， 如 一 个 最 佳 劳 埃 德 -马克 斯 量化 器 ( 见 8.2.9 节 中 的 最 
佳 量化 器 ) 。 为 构造 所 要 求 的 量化 器 , 通常 用 瑞 利 密度 函数 对 第 零 个 或 直流 系数 进行 建 模 ， 而 剩 下 的 系 
数 则 由 拉 普 拉 斯 或 高 斯 密度 函数 ? 建 模 。 分 配给 每 个 量化 器 的 量化 级 数 ( 及 比特 数 ) 与 jogxc7u ») 成 正 
比 。 这 样 ， 式 (8.2-24) 中 保留 的 系数 ( 基于 最 大 方差 选择 的 系数 ) 就 被 分 配 了 与 系数 方差 的 对 数 成 正 
比 的 比特 数 。 
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图 8.29 (一 个 烘 弄 的 区 域 模板 ; (0) 一 个 典型 的 区 域 比特 分 配 ; (0 一 个 本 型 的 六 信 模 析 
(d) 一 个 典型 的 经 阔 值 处 理 后 的 系数 排序 序列 。 用 阴影 强调 的 系数 是 保留 的 系数 


阅 值 编码 的 实现 ”区域 编码 通常 对 所 有 子 图 像 使 用 单个 固定 的 模板 来 实现 。 然 而 ， 闭 值 编码 在 为 
每 幅 彼 此 不 同 的 子 图 像 保留 变换 系数 的 位 置 方面 具有 固有 的 自 适应 性 , 实际 上 , 由 于 其 计算 的 简单 性 ， 
闵 值 编码 是 实际 中 最 常用 的 自 适应 变换 编码 方法 。 基 本 概念 是 对 于 任何 子 图 像 ， 最 大 幅 值 的 变换 系数 
对 重建 后 的 子 图 像 的 质量 的 贡献 最 大 ， 正 如 最 后 一 个 例子 中 展示 的 那样 。 

因为 不 同 子 图 像 的 最 大 系数 的 位 置 是 变化 的 ， 所 以 通常 (以 事先 定义 的 方式 ) ru vy (u,v) 的 
元 素 被 重新 排序 ， 以 形成 一 个 一 维 行程 编码 序列 。 图 8.29 (c) 显示 了 一 幅 假设 图 像 的 一 幅 子 图 像 
的 一 个 典型 国 值 模板 。 该 模板 提供 了 一 种 对 相应 子 图 像 进行 阔 值 编码 处 理 及 用 式 (8.2-24) 进 行 数 
学 描述 的 可 视 方法 。 当 模板 [ 通过 式 (8.2-24) ] 用 于 产生 该 模板 的 子 图 像 ， 并 根据 图 8.29(d) 中 
的 Z 形 模式 对 得 到 的 nxn 阵列 进行 重 排序 ， 以 形成 刁 个 元 素 的 系数 序列 时 ， 重 排序 后 的 一 维 序 
列 包含 有 一 些 0 的 长 行程 [在 图 8.29(d) 中 , 由 0 开始 , 后 跟 一 系列 数字 , Z 形 模式 变 得 很 明显 ]， 
这 些 行程 通常 被 行程 编码 。 对 应 于 包含 1 的 模板 位 置 的 非 零 系 数 或 保留 系数 ， 通 常 使 用 变 长 码 
来 表示 。 

有 三 种 基本 的 途径 对 一 幅 变 换 后 的 子 图 像 进行 阐 值 处 理 , 或 换 | - 
种 说 法 ， 有 三 种 基本 的 途径 可 以 生成 式 (8.2-23) 所 示 子 图 像 的 闭 值 模 | IR, EARN 
板 函数 : (1) 对 所 有 子 图 像 使 用 单一 的 全 局 阔 值 ;(2) 对 每 幅 子 图 像 | 一。 





D 由 于 每 个 系数 都 是 其 子 图 像 中 像素 的 线性 组 合 [ 见 式 (8.2-210) ] ， 中 心 极 限定 理 告 诉 我 们 ， 当 子 图 像 的 尺寸 增 大 时 ， 系 数 就 趋 
向 于 高 斯 形式 。 但 是 ， 因 为 非 负 图 像 总 有 正 的 直流 系数 ， 所 以 这 个 结论 不 适用 于 直流 系数 。 
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使 用 不 同 的 阔 值 ; (3) 羡 值 可 以 随 子 图像 内 每 个 系数 的 位 置 的 变化 而 变化 。 在 第 一 种 方法 中 ,对 不 同 图 
像 的 压缩 水 平 是 不 同 的 ， 具 体 取决 于 超过 全 局 阔 值 的 系数 的 数量 。 在 第 二 种 方法 ( 被 称 为 最 大 入 编码 ) 
中 ， 对 每 幅 子 图 像 都 丢掉 相同 数量 的 系数 。 结 果 ， 代 码 率 是 恒定 的 并 且 事 先 已 知 。 在 第 三 种 方法 中 ， 类 
似 于 第 一 种 方法 ， 得 到 的 代码 率 是 变化 的 ， 但 优点 是 可 以 使 用 下 式 奉 代 式 (8.2-24) 中 的 y(u, v)T (u,v) ， 

进而 把 阔 值 处 理 和 量化 结合 起 来 : 


7(u, v) =round ze] | (8.2-26) 
Z(u, v) 
th, Î (u, vie Tu, vy) 经 立 值 处 理 和 量化 后 的 近似 ，Z(u, ») 是 变换 标准 化 阵列 
ZO. 0) ZO 1) oe ZO n=1) 
ZAI, 0) 
a RS . (8.2-27) 


Z(n-1, 0) Z(n-1,1) -= Z(n-1, n-1) 
的 元 素 。 在 对 子 图 像 变 换 禄 (u,v) 标准化 ( 立 值 处 理 和 量化 ) 之 前 ， 可 对 其 取 反 变换 来 得 到 子 图 像 g(x, y) 的 
MEW, {AT (u,v) URLA Zlu, vy)。 得 到 的 去 标准 化 阵列 表示 为 了 (u,v) ， 它 是 (u,v) 的 一 个 近似 : 
T(u, v) =T(u, v)Z(u, v) (8.2-28) 
T (u,v) 的 反 变换 生成 解压 缩 子 图 像 的 近似 。 
图 8.30 (a) 以 图 形 方式 描述 了 式 (8.2-26) 在 Zu, v) 被 分 配 了 一 个 特定 值 c 的 情况 。 注 意 ， 当 且 仅 当 
FURST, Plu, 假定 整数 值 : 


ke “2 <T(u, v) < ke > (8.2-29) 


如 果 Zlu, v) > 2T(u, v), W T(u,v)=0, 且 变 换 系数 被 完全 截 去 或 丢弃 。 当 (u,v) 用 一 种 其 长 度 随 值 的 
增加 而 增 大 的 变 长 编码 表示 时 ， 用 于 表示 Tu, v) 的 比特 数 会 受 c 值 的 控制 。 因 此 ，Z 的 元 素 可 以 缩放 ， 
以 实现 各 种 压缩 水 平 。 图 8.30(b) 显示 了 一 个 典型 的 标准 化 阵列 。 广泛 用 于 JPEG 标准 ( 见 下 节 ) 中 的 这 个 
阵列 ， 根 据 试探 决定 的 感知 或 心理 视觉 的 重要 性 。 对 一 幅 变 换 后 的 子 图 像 的 每 个 系数 进行 加 权 。 





ab T(u, v) 
3 






16] 11 | 10 | 16 | 24 40 | 51 61 
12.| 12.) 14] 19 26 | 58 60 | 55 
14 | 13 | 16 | 24 | 40 57 | 69 56 
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图 8.30 ”(a) 一 条 阅 值 编码 量化 曲线 [ 见 式 (8.2-29) ] ; (b) 一 个 典型 的 标准 化 矩阵 
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例 8.16 阅 值 编码 的 说 阴 。 

图 8.31(a) 到 (f ) 显示 了 6 种 图 8.9 (a) 中 单 色 图 像 的 章 值 编码 近似 。 所 有 图 像 都 是 使 用 一 个 8x8 的 DCT 
和 图 8.30 (b) 中 的 标准 化 阵列 生成 的 。 第 一 个 结果 的 压缩 率 约 为 12:1 (BIC = 12) ， 它 是 直接 应 用 标准 化 阵列 得 
到 的 。 其 余 的 结果 , 分 别 以 19:1, 30 :1,49 21, 85 1 和 182 1 的 压缩 率 压缩 原 图 , 并 用 2、4、8、16 和 32 乘 以 ( 比 
例 放 缩 ) 标 准 化 阵列 后 生成 。 相 应 的 均 方 根 误差 分 别 是 3.83, 4.93, 6.62, 9.35, 13.94 和 22.46 个 灰 度 级 。 





图 8.31 使 用 DCT 和 图 8.30(b) 中 的 标准 化 阵列 得 到 的 图 8.9 (a) 
的 近似 : (a)Z; (b)2Z; (c)4Z; (d)8Z; (e)16Z; (f)32Z 


JPEG 使 用 最 为 普遍 且 广 泛 的 连续 色调 静止 帧 压缩 标准 是 JPEG 标准 。 它 定 义 了 三 种 不 同 的 编码 
系统 : (1) 一 种 有 损 的 基本 编码 系统 ， 该 系统 以 DCT 为 基础 :并且 适 用 于 大 多 数 压缩 ; (2) 一 种 扩展 的 编 
码 系统 ， 它 面向 更 大 压缩 、 更 高 精度 或 渐进 的 重建 应 用 ; (3) 一 种 面向 可 道 压缩 的 无 损 独立 编码 系统 。 
为 实现 JPEG 的 兼容 性 ， 产 品 或 系统 必须 包含 对 基本 系统 的 支持 。 没 有 规定 特殊 的 文件 格式 、 空 间 分 
辩 率 或 彩色 空间 模型 。 

在 通常 称 为 顺序 基线 系统 的 基线 系统 中 , 输入 和 输出 数据 的 精度 限制 为 8 比特 , 而 量化 后 的 DCT 
值 限制 为 11 比特 。 压 缩 本 身 按 三 个 顺序 步 又 执行 : DCT 计算 、 量 化 和 变 长 码 分 配 。 图 像 首先 被 细 分 
为 8x8 的 像素 块 ， 对 这 些 像素 块 按 从 左 到 右 、 从 上 到 下 的 方式 进行 处 理 。 过 到 每 个 8x8 的 块 或 子 图 像 
时 ， 其 64 个 像素 通过 减 去 2 所 进行 灰 度 级 移动 ， 其 中 2* 是 灰 度 级 的 最 大 数 。 然 后 计算 该 块 的 二 维 离 
散 余 弦 变 换 ， 根 据 式 (8.2-26) 对 其 进行 量化 ， 并 使 用 图 8.29(d) 的 Z 形 模式 对 其 重新 排序 ， 形 成 一 个 
化 系数 的 一 维 序列 。 

由 于 在 图 8.29(d) 中 的 Z 形 模式 下 生成 的 一 维 重 排序 阵列 ， 是 根据 递增 的 空间 频率 定性 地 排列 的 ， 
所 以 JPEG 编码 程序 设计 可 以 充分 利用 重 排序 得 到 长 零 行程 。 特 别 地 ， 非 零 AC" 系 数 使 用 定义 系数 值 
和 前 面 零 的 个 数 的 一 种 变 长 码 来 进行 编码 ,DC 系数 是 相对 于 前 一 幅 子 图 像 的 DC 系数 的 差 值 编码 。 
附录 A 中 的 表 A.3、 表 A.4 和 表 A.5 对 彩色 图 像 的 亮度 分 量 或 单 色 图 像 的 灰 度 提供 了 默认 的 JPEG 
霍 夫 曼 编码 。 卫 EG 推荐 的 亮度 量化 阵列 在 图 8.30(b) 中 给 出 ， 该 阵列 可 被 缩放 ， 以 提供 不 同 的 压 
缩水 平 。 该 阵列 的 缩放 允许 用 户 选择 JPEG 压缩 的 “质量 "。 尽 管 默 认 的 编码 表 和 量化 阵列 是 为 彩 
色 和 单 色 处 理 提 供 的 ， 但 用 户 可 以 自 由 地 构建 自 定义 表 和 /或 阵列 ， 这 可 以 在 事实 上 适应 被 压缩 图 


y 像 的 特点 ， 


D 在 该 标准 中 ,术语 AC 表示 除 第 零 个 或 DC 系数 外 的 所 有 变换 系数 
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差 值 为 [-26-(-17)] 或 -9， 此 值 位 于 表 A.3 的 DC 差 值 的 类 别 4 中。 根据 表 A4 的 默认 霍 夫 曼 差 值 编码 ， 类 别 
4 差 值 的 正确 基础 码 为 101 (一 个 3 比特 编码 ) ， 一 个 类 别 4 的 系数 的 完整 编码 总 长 为 7 比特 : 余下 的 4 比特 
必须 从 差 值 的 最 低 阶 比特 (LSB) 生成 。 对 于 一 个 一 般 的 DC 差 值 类 (譬如 类 别 K) ,需要 额外 的 KK 比特, 并且 
它 不 是 计算 正 差 值 的 天 个 最 低 阶 比特 ， 就 是 计算 负 差 值 的 天 个 最 低 阶 比 特 减 1。 对 于 差 值 -9, 合适 的 最 低 
阶 比 特 4LSB) 为 (011D) =- 工 或 0110， 而 且 完 全 DPCM 编码 的 DC 码 字 是 1010110。 

重 排 阵列 的 非 零 AC 系数 根据 表 A.3 和 表 AS 进行 类 似 的 编码 。 主 要 差别 在 于 ， 每 个 默认 的 AC EK 
曼 码 字 依 赖 于 前 一 个 被 编码 的 非 零 值 系数 的 数量 , 以 及 非 零 系 数 大 小 的 分 类 ( 见 表 A.5 中 标 为 “行程 /分 类 ” 
列 ) 。 因 此 ， 重 排 阵列 的 第 一 个 非 零 AC 系数 (3) 被 编码 为 0100。 该 码 的 前 两 个 比特 表明 ， 这 个 系数 属于 
大 小 分 类 2， 并 且 前 面 没有 和 零 值 系数 ( 见 表 A.3) ; 最 后 两 个 比特 是 使 用 与 获得 DC 差 值 编码 的 最 低 阶 比特 
(LSB) 相同 的 处 理 生成 的 。 继 续 使 用 这 种 方法 ， 完 整编 码 ( 重 排序 ) 阵列 为 

1010110 0100 001 0100 0101 100001 0110 100011 001 
100011 001 001 100101 11100110 110110 0110 11110100 000 1010 

为 阅读 方便 起 见 ， 这 里 插入 了 空格 。 尽 管 在 这 个 例子 中 并 不 需要 这 个 阵列 ， 但 默认 的 JPEG 码 包含 了 一 个 
对 于 15 个 零 后 跟 一 个 0 的 行程 的 专用 码 字 ( 见 表 A.5 中 的 分 类 0 和 行程 F) 。 在 完全 编码 后 的 重 排 阵列 中 ， 
总 比特 数 (在 这 个 例子 中 ， 要 求 用 于 表示 整 由 8x8 大 小 的 8 比特 子 图 像 的 比特 数 ) 是 92。 得 到 的 压缩 率 是 
512/92， 或 大 约 为 5.6:1。 

-为 解压 缩 一 幅 压 缩 后 的 JPEG 子 图 像 ， 解 码 器 必须 首先 重建 产生 压缩 比特 流 的 已 规格 化 的 变换 系数 。 
因为 一 个 经 堆 夫 曼 编码 的 二 进 制 序列 是 瞬时 和 唯一 可 解码 的 , 所 以 使 用 简单 的 查找 表 方式 就 可 以 很 容易 地 
完成 这 一 步骤 。 这 里 ， 重 新 生成 的 量化 系数 阵列 是 : 


—26 -2 -6 2 2 0 0 0 
1 -2 4 0 0 0 0 0 
3 1 > -1 一 0 0 0 
tf 1 2 =] 0 0 0 0 
1 0 0 0 0 0 0 0 
0 0 0 0 0 0 0 0 
0 0 0 0 0 0 0 0 
0 0 0 0 0 0 0 0 
根据 式 (8.2-28) 去 规格 化 后 ， dint 

416 -33 32 48 0 0 0 
12 -24 8-56 0 0 0 0 0 
42 13 80 -24 —40 0 0 0 
-56 17 4 -29 0 0 0 0 
18 0 0 0 0 0 0 0 
0 0 0 0 0 0 0 0 
: 0 0 0 0 0 0 0 
0 0 0 0 0 0 0 


其 中 ， 例 如 ，DC REIRE TRH: 
7(0, 0)=7(0, 0)Z(0, 0) = (-26)(16) = -416 
完全 重建 的 子 图 像 是 通过 (8.2-11) 和 式 (8.2-18) 取 去 规格 化 阵列 的 反 DCT 得 到 的 ， 由 此 得 到 


~70 -64 —61 -64 -69 一 66 =58 ， -50 
=72 =73 -61 -39 -30 —40 -54 -59 
—68 -78 -58 -9 13 -2 —48 —64 
=59 =77 ST 0 22 -13 =5} —60 
—54 -75 -64 -23 -13 —44 -63 -60 
52 -71 -72 -54 -54 -71 = -54 
一 5 =59 -70 -68 -67 -67 -61 -50 
=a 一 7 -61 —66 -60 —48 4 一 4 
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然后 对 每 个 反 变换 后 的 像素 移 位 +2” (或 +128) 个 灰 度 级 ， 得 到 


58 64 67 64 59 62 70 78 
56 55 67 89 98 88 74 69 
60 50 7 119 141 116 80 64 
69 51 n A8 149 115 77 68 
74 53 64 1% 115 84 65 72 
76 57 56 74 75 57 57 74 
83 69 59 60 61 61 67 78 
93 81 67 62 69 80 84 84 


原始 子 图 像 和 重建 子 图 像 之 间 的 任何 差别 ， 都 是 由 JPEG 压缩 和 解压 缩 处 理 的 有 损 性 质 造 成 的 。 在 这 个 例 
子 中 ， 误 差 范 围 是 从 -14 到 +11， 并 且 按 如 下 方式 分 布 : 


-6 -9 6 2 11 fi 6 ca 
7 4 =] 1 11 -3 -5 3 
2 9 22 -6 i -14 9 
6 7 0 4 3 -9 -7 1 
= 8 4 el 6 4 3 2) 
3 8 4 4 2 6 1 1 
2 2 5 -i -6 0 Bb 

6 2 2 6 4 4 6 10 


整个 压缩 和 重建 处 理 的 均 方 根 误差 接近 5.8 个 灰 度 级 。 


例 8.18 JPEG 编码 的 说 明 。 

图 8.32 (a) 和 (d) 显示 了 图 8.9 (a) 所 示 单 色 图 像 的 两 种 JPEG 近似 。 第 一 个 结果 提供 了 25:1 的 压缩 ; 
第 二 个 用 52:1 的 比率 压缩 原始 图 像 。 图 8.32 (a) 中 的 原 图 像 和 图 8.32(d) 中 的 重建 图 像 之 间 的 差分 别 显示 
在 图 8.32 (b) 和 图 8.32(e) 中 。 相 应 的 均 方 根 误差 是 5.4 和 10:7 个 灰 度 级 。 误差 在 图 8.32(c) 和 图 8.32 (f) 
的 放大 图 像 中 清晰 可 见 。 这 些 图 像 分 别 显示 了 图 8.32(a) 和 图 8.32 (d) 的 局 部 放大 。 ER, JPEG 块 效应 
随 压 缩 率 的 增 大 而 增 大 。 





& 
| J | d 6 f 
图 8.32 图 8.9(a) 的 两 种 JPEG 近似 。 每 一 行 包含 压缩 和 重建 后 的 结 
果 ， 该 结果 和 原 图 像 间 放大 后 的 差 ， 以 及 重建 图 像 的 局 部 放大 
8.2.9 预测 编码 


现在 我 们 转向 一 种 更 简单 的 压缩 方法 ， 这 种 方法 不 需要 较 大 计算 开销 就 可 实现 较 好 的 压缩 效 
R, 并且 可 以 是 无 误差 的 或 有 损 的 压缩 。 这 种 方法 通常 称 为 预测 编码 ， 它 是 通过 消除 紧邻 像素 在 [0 
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空间 和 时 间 上 的 完 余 来 实现 的 , 它 仅 对 每 个 像素 中 的 新 信息 进行 提 SERI HEBA, HOMRRIFE 
取 和 编码 。 一 个 像素 的 新 信息 定义 为 该 像素 的 实际 值 与 预测 值 之 间 | JBIG2、JPEG、JPEG-LS、MPEG-1,2,4、 


的 差 。 H.261, H.262, H.263, H.264. HDV, VC-1 






和 其 他 压缩 标准 与 文件 格式 中 。 


无 损 预 测 编码 


图 8.33 显示 了 一 个 无 损 预测 编码 系统 的 基本 组 成 。 该 系统 由 一 个 编码 器 和 一 个 解码 器 组 成 ， 编 码 
器 和 解码 器 中 均 包 含有 一 个 相同 的 预测 器 。 离 散 时 间 输 入 信号 /(n) 的 连续 样本 被 传人 编码 器 ,预测 器 
根据 指定 数量 的 以 往 样本 来 生成 每 个 样本 的 预期 值 。 然后 , 预测 器 的 输出 被 四 舍 五 人 为 最 接近 的 整数 ， 
表示 为 Am) ， 并 使 用 这 个 整数 来 形成 差 值 或 预测 误差 


e(n) = f(n)— f(n) (8.2-30) 


a fin) e(n) 

b ot a 符号 编码 器 一 > 压缩 后 的 序列 
最 接近 

Ei fin) 


e(n) fin) 
压缩 后 的 序列 符号 解码 器 解压 缩 后 的 序列 


fin) 
图 8.33 一 个 无 损 预 测 编码 模型 ，(a) Satie; (b) 解码 器 
使 用 变 长 码 来 对 这 个 误差 进行 编码 (用 符号 编码 器 ) , 以 生成 压缩 数据 流 的 下 一 个 元 素 : 图 8.33 (b) 中 的 
解码 器 根据 接收 到 的 变 长 码 字 重建 e(n) ， 并 执行 反 操作 
f(n)=e(n)+ fn) (8.2-31) 
以 解压 缩 或 重建 原始 输入 序列 。 


可 使 用 各 种 局 部 的 、 全 局 的 和 自 适应 的 方法 ( 见 “ 有 损 预 测 编码 ”一 节 ) 来 生成 ,ma) 。 在 大 多 数 情 
况 下 ,预测 是 由 前 m 个 样 值 的 线性 组 合生 成 的 ， 即 


f(n)=round È a; f(n -») (8.2-32) 
i=l 


IP, m 是 线性 预测 器 的 阶 ，round 表示 四 舍 五 入 或 取 最 接近 整数 的 操作 ，@;，i=1,2,…,m 是 预测 系 
数 。 如 果 将 图 8.33 (a) 中 的 输入 序列 视 为 一 幅 图 像 的 样本 , 那么 式 (8.2-30) 到 式 (8.2-32) 中 的 f(n) 就 是 
像素 ,用 于 预测 每 个 像素 值 的 m 个 样本 来 自 当前 扫描 行 ( 称 为 一 维 线性 预测 编码 ) 、 当 前 行 和 前 几 个 扫 
描 行 ( 称 为 二 维 线性 预测 编码 ) ， 或 来 自 图 像 序列 的 当前 图 像 和 前 几 幅 图 像 ( 称 为 三 维 线性 预测 编码 ) 。 
这 样 ， 对 于 一 维 线性 预测 图 像 编 码 ， 式 (8.2-32) 可 以 写 为 


f(x, y) = ound $ a f(x, y -| (8.2-33) 
i=l 


06) 其 中 ， 每 个 样本 现在 被 明确 地 表达 为 输入 图 像 空间 坐标 xx 和? 的 函数 。 注 意 , 式 (8.2-33) 表 明 一 维 





中 线性 预测 仅 是 当前 行 上 前 几 个 像素 的 函数 。 在 二 维 预 测 编码 中 ， 预 测 是 一 幅 图 像 从 左 到 右 、 从 上 
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到 下 扫描 的 前 几 个 像素 的 函数 。 在 三 维 情况 下 ， 预 测 是 以 这 些 像素 和 前 几 帧 图 像 的 前 几 个 像素 为 基 
础 的 。 式 (8.2-33) 不 能 对 每 一 行 的 前 m 个 像素 进行 求 值 ， 因 此 必须 使 用 其 他 方式 (如 霍 夫 曼 编码 ) 来 
对 这 些 像素 编码 ， 并 将 这 种 编码 考虑 为 预测 编码 处 理 的 一 种 额外 开销 。 类 似 的 说 明 适 用 于 更 高 维 的 
情况 。 

例 8.19 ”预测 编码 和 空间 元 余 。 

考虑 使 用 来 自 式 (8.2-33) 的 简单 一 阶 ( 即 m=1) 线 性 预测 器 对 图 8.34 (a) 中 的 单 色 图 像 进行 编码 : 


f(x, y) =round[a f(x, y—1)] hs 


该 式 是 式 (8.2-33) 在 m=1 且 只 有 一 个 预测 系数 i (此 时 下 标 已 无 意义 ) 时 的 简化 形式 。 这 种 一 般 形 式 的 预 
测 器 称 为 前 像素 预测 器 ， 对 应 的 预测 编码 过 程 称 为 差分 编码 或 前 像素 编码 。 图 8.34(c) 显示 了 由 式 (8.2-34) 


在 =1 时 得 到 的 预测 误差 图 像 ， 即 e(x,y)= f(x,y) - Í y) o 这 幅 图 像 是 按 如 下 方式 缩放 的 : IRJE 128 
表示 一 个 零 预 测 误差 , 而 所 有 非 零 的 正 预 测 误差 和 负 预 测 误差 ( 低 于 和 超过 估计 ) 分 别 显示 为 更 亮 的 和 更 
瞳 的 灰 度 色调 - 预测 图 像 的 均值 为 128.26s 因为 灰 度 128 对 应 于 0 预测 误差 , 所 以 平均 预测 误差 仅 为 0.26 
比特 。 
图 8&34(b) 和 (中 分 别 显示 了 图 8.34(a) 中 国 像 的 灰 度 直方 图 和 预测 误差 oe VUDA. 注意 ,图 8.34(d) 

中 预测 误差 的 标准 差 要 比 原 图 像 中 灰 度 的 标准 差 小 得 多 。 另外 , 用 式 (8.1-7) f HRM ee A T 
SPER AOE (3.99 比特 /像素 对 7.25 比特 /像素 ) 。 这 种 录 的 降低 反映 了 大 量 空间 元 余 的 消除 ， 尽管 对 于 
比特 图 像 需 要 (k +1) 比特 数 来 准确 地 表示 预测 误差 序列 e(x,y) 。 通 常 ， 

注意 , 变 长 编码 的 预测 误差 是 压缩 
预测 编码 方法 的 最 大 压缩 率 可 用 表示 原 图 像 中 每 个 像素 的 平均 比特 数 除 后 的 图 像 。 
以 预测 误差 的 彤 的 估计 来 估算 。 在 这 个 例子 中 - 任何 变 长 编码 过 程 都 可 用 一 
于 e(x,y) 的 编码 ， 但 得 到 的 压缩 率 将 限制 在 约 8/3.99 或 2:1 左右 。 
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图 834 ”所 来 自生 道 空间 航天 飞机 的 地 球 景色 ; (b) a) 的 灰 度 直 方 图 ，(c) 由 式 (8.2.34) 
得 到 的 预测 误差 图 像 ;，(d) 预 测 误差 的 直方 图 ( 原 图 像 由 NASA 提供 ) 
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前 面 的 例子 说 明 ， 预 测 编码 达到 的 压缩 与 将 输入 图 像 映射 到 一 个 预测 误差 序列 所 得 到 的 炳 的 减少 
直接 相关 ， 通 常 称 为 预测 残 差 。 因 为 通过 预测 和 差分 处 理 消 除了 空间 元 余 ， 所 以 ， 预 测 残 差 的 概率 密 
度 函数 通常 在 零 处 会 有 一 个 很 高 的 峰值 ， 并 由 一 个 相对 较 小 的 方差 与 输入 灰 度 分 布 相 比 ) 来 表征 。 实 
际 上 ， 它 常常 由 零 均 值 不 相关 拉 普 拉 斯 概率 密度 函数 (PDF) 建 模 : 
= 
e% (8.2-35) 





p.(e) = Je, 
式 中 ，o, 是 e 的 标准 差 。 
例 8.20 ”预测 编码 和 时 间 宛 余 。 
图 8.34 (a) 中 的 图 像 是 NASA 的 一 帧 视频 的 一 部 分 ， 其 中 地 球 正 相 对 于 安装 在 空间 航天 飞机 上 的 固定 
摄像 机 从 左 到 右 移动 。 图 8.35 (b) 显示 的 是 图 8.35 (a) 的 前 一 帧 的 重复 图 像 。 使 用 一 阶 线性 预测 器 
GAO round[a f(x, y, 1-1] o (8.2-36) 
， 则 图 8.35 (b) 中 的 像素 的 灰 度 可 由 图 (a) 中 的 对 应 像素 来 预测 。 图 8.34(c) 是 得 到 的 预测 残 差 图 像 
ape SED- J (x,y:t) o E 8.34(d) Æ e(x, y,t) 的 直方 图 。 注 意 ， 有 很 小 的 预测 误差。 该 六 误差 的 标准 
差 远 小 于 前 一 个 例子 中 的 标准 差 一 3 76 比特 /像素 对 15.58 比特 /像素 。 另 [一 
外 ,预测 误差 的 炳 [使 用 式 (8.1-7) 计算 ] 已 从 3.99 比特 /像素 减 小 到 2.59 T 18 
比特 /像素 。 通过 对 得 到 的 预测 残 差 进行 变 长 编码 ， 原 图 像 的 压缩 率 接近 
8/2.59 或 3.1:1 一 与 例 8.19 中 使 用 面向 空间 的 前 像素 预测 器 得 到 的 2 :1 的 压缩 率 相 比 改进 了 50%。 
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图 8.35 (a)~(b) 来 自 轨道 空间 航天 飞机 视频 的 两 幅 地 球 景观 图 ; (c) 由 式 (8.2-36) 
得 到 的 预测 误差 图 像 ，(d) 预测 误差 的 直方 图 ( 原 图 像 由 NASA 提供 ) 
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运动 补偿 预测 残 差 
如 例 8.20 中 看 到 的 那样 ,视频 序列 中 的 连续 帧 通常 是 很 相似 的 。 对 它们 的 差 值 进行 编码 可 减少 时 
间 元 余 并 提供 有 效 的 压缩 。 然 而 ， 当 帧 序列 包含 快速 运动 的 目标 时 (或 者 涉及 摄像 机 缩放 与 摇 镜 头 、 
场景 的 突然 变化 ， 或 者 涉及 淡 入 和 淡出 )， 相 邻 帧 间 的 相似 性 就 会 降低 ， 从 而 对 压缩 率 造成 负面 影响 。 
也 就 是 说 , 像 大 多 数 压缩 技术 那样 ( 见 例 8.5) ， 基 于 时 间 的 预测 编码 对 某 种 类 型 的 输入 ， 即 具有 重要 的 


时 间 宛 余 的 图 像 序列 ， 才 工作 得 最 好 。 用 于 处 理 有 很 少时 间 宛 余 的 图 像 时 ， 会 发 生 数据 扩展 。 视 频 压 
缩 系统 避免 数据 扩展 问题 的 方法 有 如 下 两 种 : 


1. 在 预测 和 差分 处 理 期 间 ， 跟 踪 目标 运动 并 对 其 进行 补偿 。 

2. 存在 帧 间 相关 ( 帧 间 的 相似 性 ) 而 不 足以 发 挥 预测 编码 的 优点 时 ， 转 换 到 另 一 种 编码 方法 。 

第 一 种 方法 ( 称 为 运动 补偿 ) 是 该 节 剩余 内 容 的 主题 。 但 在 这 之 前 ， 我 们 注意 到 ， 当 帧 间 相关 不 足 
以 使 预测 编码 有 效 时 , 第 二 个 问题 典型 地 采用 一 种 面向 块 的 二 维 变换 , 如 JPEG 的 基于 DCT 的 编码 ( 见 
8.2.8 节 ) 。 在 这 种 方法 中 , 压缩 后 的 帧 ( 即 没有 预测 残 差 的 帧 ) 称 为 内 帧 或 独立 帧 T 帧 ) 。 它 们 可 以 在 不 
访问 属于 视频 的 其 他 帧 的 情况 下 来 解码 。I 帧 通常 类 似 于 JPEG 编码 图 像 , 并 且 是 生成 预测 残 差 的 理想 
起 点 。 此 外 ， 它 们 提供 了 高 度 的 随机 访问 ， 容 易 编辑 ， 并 能 阻止 传输 误差 的 传播 。 因 此 ， 所 有 的 标准 
都 要 求 周期 性 地 将 I 帧 插入 到 压缩 的 视频 码 流 中 。 

图 8.36 说 明了 运动 补偿 预测 编码 的 基本 原理 。 每 个 视频 帧 都 被 分 昌吉 能 " 位置 呈 指 这 样 的 个 位 
解 成 不 重 著 的 矩形 区 域 , 这 些 区 域 的 典型 尺寸 为 4x4 到 16x16, PAE | 置 , 该 位 置 可 使 得 参考 宏 块 和 正 被 纺 
块 (图 8.36 中 仅 示 出 了 一 个 宏 块 ) .每 个 宏 块 相对 于 它 在 前 一 视频 帧 ( 称 | 码 密 块 间 的 误差 度量 最 小 。 这 两 个 志 
为 参考 帧 ) 中 的 “最 合适 的 ”位 置 的 “运动 "， 以 运动 向 量 来 编码 。 该 | PERO A Benet 
向 量 通过 定义 距 “ 最 合适 的 ”位 置 的 水 平 距离 和 垂直 距离 来 描述 运动 。 
位 移 通常 规定 为 最 近 像素 、1/2 像素 或 1/4 像素 精度 。 如 果 用 亚 像素 精度 ， 就 必须 通过 参考 帧 中 的 像素 
组 合 使 用 内 插 [如 使 用 双 线 性 内 插 ( 见 2.4.4 节 ) ]。 一 个 基于 前 一 帧 的 编码 帧 (图 8.36 中 的 前 向 预测 ) 称 
为 预测 帧 (P 帧 ) ;一 个 基于 后 一 帧 的 编码 帧 (图 8.36 的 后 向 预测 ) 称 为 双向 帧 (B 帧 ) 。B 帧 要 求 对 压缩 
的 码 流 重新 排序 ， 以 便 这 些 帧 以 合适 的 编码 序列 而 非 自 然 显示 顺序 的 序列 提供 给 解码 器 。 








图 8.36 ” 宏 块 运动 的 规定 


如 所 期 望 的 那样 ， 运 动 估计 是 运动 补偿 的 关键 部 分 。 在 运动 估计 期 间 ， 物 体 的 运动 被 测量 并 编码 
为 运动 向 量 。 对 “最 好 的 ”运动 向 量 的 搜索 要 求 定义 一 个 最 佳 准则 。 例 如 ， 运 动向 量 可 在 宏 块 像素 和 
所 选 参 考 帧 中 的 预测 像素 (对 于 亚 向 素 运动 向 量 内 插 后 的 象 素 ) 之 间 的 最 大 相关 或 最 小 误差 的 基础 上 选 
择 。 最 常用 的 一 种 误差 度量 是 平均 绝对 失真 (MAD) : 


MAD(x, 及 = 二 六 > [seri y+ j)—p(xtitdx, y+ j+dy)| ` (8.2-37) 


i=l j=l 
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式 中 , x 和 y 是 被 编码 的 mxn 宏 块 的 左上 角 像 素 的 坐标 ，dx 和 dy 是 如 图 8.36 所 示 的 来 自 参 考 帧 的 位 
B, p 是 预测 的 宏 块 像素 值 的 一 个 阵列 。 对 于 亚 像素 运动 向 量 估计 ，P 来 自 参 考 帧 中 像素 的 内 插 。dx 
和 dy 通常 必须 落 在 围绕 每 个 宏 块 的 一 个 有 限 搜索 区 域内 ( 见 图 8.36) ， 其 值 通常 为 +8 FI) +04 像素 ,水 
平 搜索 区 域 通常 要 比 垂直 搜索 区 域 稍 大 。 一 种 更 有 效 的 推算 误差 的 测量 称 为 绝对 失真 和 (SAD) ， 它 在 
式 (8.2-37) 中 省 略 了 因子 1/mn。 

给 定 一 个 如 式 (8.2-37) 所 示 的 选择 准则 ， 在 运动 向 量 位 移 允 许 的 范围 内 ， 包 括 亚 像素 位 移 ， 用 最 
小 MAD 搜索 dx 和 dy 执行 运动 估计 。 这 种 处 理 通 常 称 为 块 匹配 。 一 种 穷 举 搜索 可 保证 最 好 可 能 的 结 
果 ， 但 其 计算 代价 高 昂 ， 因 为 必须 在 整个 位 移 范围 内 对 每 个 可 能 的 运动 进行 测试 。 对 于 大 小 为 16x16 
MEIRA +32 像素 的 位 移 范围 (对 于 影片 和 运动 事件 没有 超出 问题 的 范围 ) ， 当 使 用 整数 位 移 精度 时 ， 
对 于 一 个 帧 内 的 每 个 宏 块 ， 必 须 执行 4225 次 16x16 MAD 计算 。 如 果 要 求 使 用 1/2 像素 或 1/4 像素 的 
精度 ,计算 的 次 数 还 应 分 别 乘 以 4 或 16。 快速 搜索 算法 可 以 减少 计算 负担 , 但 可 能 会 也 可 能 不 会 得 到 
最 佳 运动 向 量 。 在 文献 中 已 经 提出 并 研究 了 许多 基于 块 的 快速 运动 估计 算法 (例如 ,参见 Furht et 
al.[1997] 和 Mitchel et al.[1997]) 。 


例 8.21 运动 补偿 预测 。 

图 8.37(a) 和 (b) 取 自 例 8.19 和 例 8.20 中 使 用 过 的 相同 NASA 视频 序列 。 图 837 ) 与 图 8 34(a) 和 
图 8.35 (b) 相同; 图 8.37 (a) 是 之 前 出 现 的 13 帧 中 的 一 帧 的 一 部 分 。 图 8.37 (c) 是 两 幢 间 的 差 ， 它 被 放大 到 
全 部 灰 度 范围 。 注 意 ， 在 航天 飞机 的 恒定 部 分 ， 该 差 为 0( 相 对 于 摄像 机 ) ， 但 在 图 像 的 其 余部 分 由 于 地 球 
的 相对 运动 有 较 大 的 差别 。 图 8.37(c) 中 预测 残 差 的 标准 差 是 12.73 个 灰 度 级 ; 它 的 炉 [用 式 (8.1-7) 计 算 ] 
是 417 比特 /像素 。 使 用 变 长 编码 对 预测 残 差 进行 编码 时 ， 可 能 达到 的 最 大 压缩 率 为 C= 8/4.17 = 1.92. 





图 837 (a)~(b) 自 绕 轨道 飞行 的 航天 飞机 视频 中 截取 的 间隔 13 帧 的 两 幅 地 球 景色 图 ; 
(c) 没有 运动 补偿 的 预测 误差 图 像 ;，(d) 有 运动 补偿 的 预测 残 差 图 像 ，(e) 与 图 (d) 
相关 的 运动 向 量 ,图 (d) 中 的 白 点 表示 描述 运动 向 量 的 窗 头 ( 原 图 像 由 NASA 提供 ) 


图 8.37(d) 显示 了 使 用 非常 低 的 标准 差 (5.62 灰 度 级 相对 于 12.73 个 灰 度 级 ) AVA HG (3.04 比特 / 
像素 相对 于 4.17 比特 /像素 ) KAMAR. MHR (8.1-7) 计算 。 如 果 图 8.37(d) 中 的 预测 残 差 
用 变 长 编码 ， 得 到 的 压缩 率 为 C= 8/3.04 = 2.63。 为 产生 这 一 预测 残 差 ， 我们 把 图 8.37(b) 分 成 不 重 苹 
的 16x16 宏 块 ， 并 将 每 个 宏 块 与 图 8.37 (a) 中 的 每 个 16x16 区 域 [ 落 入 图 (b) 中 宏 块 位 置 的 +16 像素 范 
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围 内 的 参考 帧 ] 相 比较 。 我 们 使 用 式 (8.2-37) ， 通 过 选择 具有 最 低 MAD 的 位 移 (dx, dy) 确定 最 好 的 匹配 。 
得 到 的 位 移 是 图 837(e) 中 运动 向 量 的 x 分 量 和 y 分 量 。 图 中 的 白 点 是 运动 向 量 的 头 部 ; 它们 指出 编码 宏 块 
的 左上 角 。 如 从 向 量 模式 看 到 的 那样 ， 图 像 中 主要 的 运动 是 从 左 到 右 的 运动 。 在 图 像 较 低 的 部 分 (对 应 于 
原始 图 像 航天 飞机 的 区 域 )， 由 于 没有 运动 ， 因 此 没有 显示 出 运动 向 量 。 这 一 区 域 中 的 宏 块 是 由 参考 帧 中 
相似 位 置 的 ( 即 相对 应 的 ) 宕 块 来 预测 的 。 因 为 图 837(e) 中 的 运动 向 量 是 高 度 相关 的 ， 所 以 可 以 对 它们 进 
行 变 长 编码 以 减少 它们 的 存储 和 传输 需求 。 


图 8.38 说 明了 可 使 用 亚 像素 运动 补偿 提高 预测 精度 。 图 8.38 (a) 
是 图 8.37(c) 的 重复 ， 并 包括 一 个 参考 点 ; 它 显 示 了 没有 运动 补偿 的 “| 差别 是 由 缩放 造成 的 图 838() 中 | 
预测 误差 。 图 8.38(b)，(c) 和 (d) 是 经 运动 补偿 后 的 预测 残 差 。 它 们 基 | 的 图 像 已 被 缩放 到 与 图 8.38 (b)~(d) 
于 例 8.21 中 用 过 的 相同 两 帧 , 并 使 用 宏 块 位 移 分 别 为 1, 1/2 和 1/4 像素 LER 
分 辨 率 ( 即 精度 ) 来 计算 。 使 用 大 小 为 8x8 的 宏 块 ; 位 移 被 限制 到 +8 个 像素 。 

图 8.38 中 预测 残 差 间 最 重要 的 视觉 差别 是 灰 度 的 峰值 和 谷 值 〈 即 灰 度 最 暗 和 最 亮 的 区 域 ) 的 
数量 与 大 小 。 图 8.38 (d) 中 的 1/4 像素 残 差 是 4 幅 图 像 中 “最 平坦 的 "， 具 有 最 少 的 黑 或 白 偏 移 。 如 
所 期 望 的 那样 ， 它 有 最 窄 的 直方 图 。 图 8.38 (a) 到 (d) 中 的 预测 残 差 的 标准 差 随 运动 向 量 精度 的 增 
加 而 减 小 一 一 分 别 从 12.7 像素 减 小 到 4.4 像素 ， 从 12.7 像素 减 小 到 4 像素 和 减 小 到 3.8 像素 。 由 
式 (8.1-7) 确 定 的 残 差 的 炉 分 别 为 4.17, 3.34, 3.35 和 3.34 比特 /像素 。 这 样 ， 运 动 补偿 后 的 残 差 就 包 
含 相同 的 信息 量 , 尽管 图 8.38 (c) 和 (d) 中 的 残 差 是 使 用 附加 比特 来 提供 1/2 和 1/4 像素 的 内 插 。 最 
后 ， 我 们 注意 到 ， 在 每 个 运动 补偿 后 的 残 差 的 左 侧 ， 都 有 一 条 明显 的 增 大 预测 误差 的 条 带 。 这 是 
由 于 地 球 从 左 到 右 的 运动 ， 它 把 地 球 上 的 新 的 或 以 前 看 不 到 的 地 形 区 域 带 进 了 每 幅 图 像 中 的 左 侧 
区 域 。 因 为 前 几 帧 中 不 存在 这 些 区 域 ， 所 以 不 管 使 用 的 计算 运动 向 量 的 精度 如 何 ， 它 们 都 不 能 被 
准确 地 预测 。 


图 8.37(c) 和 图 8.38(a) 间 的 视觉 








abcd 


图 8.38” 亚 像素 运动 补偿 后 的 预测 残 差 : (a) 没有 运动 补偿 ; (b) 单 像素 精度 ; (c) 1/2 像素 精度 ; (d) 1/4 
像素 精度 (所 有 预测 误差 都 已 被 放大 到 整个 灰 度 范围 ,然后 乘 以 2， 以 增加 它们 的 可 视 性 ) 


运动 估计 是 一 项 要 求 计算 量 的 任务 。 所 幸 的 是 ， 只 有 编码 器 必须 估计 宏 块 运动 。 给 定 这 些 宏 块 
的 运动 向 量 ， 解 码 器 只 须 简单 地 访问 编码 器 中 用 于 形成 预测 残 差 的 参考 帧 的 区 域 。 因 为 这 一 原因 ， 
运动 估计 未 包括 在 大 多 数 视 频 压 缩 标准 中 。 压 缩 标准 集中 在 解码 右上 一 一 在 宏 块 维 数 、 运 动向 量 精 
度 、 水 平和 垂直 位 移 范围 等 参数 上 设置 约束 条 件 。 表 8.11 给 出 了 一 些 最 重要 的 视频 压缩 标准 的 关键 
预测 编码 参数 。 注 意 ， 针 对 工 帧 编码 ， 大 多 数 标准 使 用 大 小 为 8x8 的 DCT， 但 对 运动 补偿 规定 了 更 
大 的 区 域 (如 大 小 为 16x16 的 宏 块 )。 另 外 ， 由 于 DCT 系数 量化 的 有 效 性 ，P 帧 和 B 帧 预测 残 差 甚至 也 
用 变换 编码 。 最 后 ， 我 们 注意 到 ，H.261 和 MPEG-4 AVC 标准 支持 帧 内 预测 编码 (在 I 帧 内 ) ， 以 减少 空 
间 元 余 。 
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表 8.11 视频 压缩 标准 中 的 预测 编码 


运动 向 量 精度 
ERK 






Miisa fe rin ena Bk), 图 839 中 的 “ 友 量 化 器 ”确实 
觉 特性 。 我 们 可 以 认为 输入 到 编码 器 的 是 顺序 的 视频 宏 抉 。 对 于 彩色 | 下 信里 止 信息 损失 。 
视频 ， 每 个 宏 块 都 由 一 个 亮度 块 和 两 个 彩色 块 组 成 。 因 为 眼睛 对 彩色 的 空间 敏锐 度 远 小 于 对 亮度 的 空 
间 人 敏锐 度 ， 所 以 彩色 块 通常 以 亮度 块 的 水 平和 垂直 分 辩 率 的 一 半 来 取样 。 图 中 加 灰 的 部 分 是 JPEG 纺 
码 器 的 并 行 变换 、 量 化 和 变 长 编码 操作 。 主 要 的 差别 是 输入 , 它 可 能 是 图 像 数 据 的 传统 宏 块 (对 于 I 帧 ) ， 
或 者 是 传统 宏 块 和 根据 前 几 个 视频 帧 或 相继 的 视频 帧 预测 间 的 差 值 对 于 了 帧 和 B 帧 ) 。 编码 器 包括 一 
个 反 量化 器 和 反映 射 器 ( 即 反 DCT) ， 以 便 其 预测 与 互补 解码 器 的 那些 预测 相 匹配 。 此 外 ， 它 被 设计 用 
于 产生 与 预期 的 视频 信道 容量 相 匹 配 的 压缩 比特 流 。 为 完成 这 一 任务 ， 量 化 参数 由 一 个 码 率 控制 器 来 
调整 ， 码 率 控制 器 是 输出 缓冲 器 占用 量 的 函数 。 当 缓冲 器 变 得 较 满 时 ， 量 化 就 粗 一 些 ， 以 便 较 少 的 比 
特 流 进入 缓冲 器 。 





图 8.39 一 个 典型 的 运动 补偿 视频 编码 器 
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例 8.22 视频 压缩 的 例子 。 

我 们 用 一 个 例子 来 结束 对 运动 补偿 预测 编码 的 讨论 ， 该 例 说 明了 使 用 现代 视频 压缩 方法 的 压缩 种 类 。 
图 8.40 显示 了 1 分 钟 的 NASA 高 清 (1280x720) 全 彩色 视频 的 15 帧 , 它们 os 
的 一 部 分 已 在 本 节 用 过 。 虽 然 显示 的 图 像 是 单 色 的 ， 但 视频 是 1829 幅 全 |e Seen | 
彩色 帧 序列 。 注 意 ， 有 各 种 场景 、 大 量 的 运动 和 多 样 的 淡 入 淡出 效果 - 例 一 一 一 一 
如 , 该 视频 的 150 帧 以 黑色 淡 入 方式 打开 ,包括 图 8.40 中 的 第 21 帧 和 第 44 帧 ,并 用 图 8.40 中 包含 的 第 1595 
帧 、 第 1609 帧 和 第 1652 帧 的 淡出 序列 ， 并 紧 接着 淡出 到 黑色 结束 。 还 有 一 些 急 剧变 化 的 场景 ， 如 图 8.40 
中 第 1303 帧 和 第 1304 帧 所 涉及 的 变化 。 

以 Quicktime 文件 ( 见 表 8.4) 存 储 的 NASA 视频 H.264 压缩 的 版 本 要 求 44.56 MB 的 存储 空间 一 一 加 上 
另外 1.39MB 的 相关 音频 。 视频 质 量 很 高 。 对 于 不 压缩 的 全 彩色 图 像 视频 帧 的 数据 存储 需要 约 为 5 GB。 还 
应 注意 到 ,视频 还 包含 涉及 旋转 和 缩放 变化 的 序列 ( 即 图 8.40 中 包括 第 959 帧 、 第 1023 帧 和 第 1088 帧 的 序 
列 ) ， 但 本 节 的 讨论 仅 限于 平移 。 
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pane 1595 Frame 1609 eerie 1652 z 
图 8.40 来 自 1 分钟 、1829 WAS NASA 视频 的 15 帧 图 像 。 原 
始 视频 是 全 彩色 高 清 视频 ( 原 视频 由 NASA 提供 ) 
有 损 预测 编码 
本 节 在 先前 介绍 的 无 损 预 测 编码 模型 中 加 入 一 个 量化 器 ;并 在 关于 空间 预测 器 的 上 下 文中 ， 


617 


探讨 重建 精度 和 压缩 性 能 间 的 折 中 。 如 图 8.41 所 显示 的 那样 ， 代 替 无 误差 编码 器 的 取 最 接近 整数 leg 
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功能 的 量化 器 ,被 插入 到 了 符号 编码 器 和 形成 预测 误差 的 那 一 点 之 间 。 该 量化 器 将 预测 误差 映射 为 有 


限 范围 内 的 输出 ， 表 示 为 e(n) ， 它 确定 了 压缩 量 和 产生 的 失真 量 。 


> (1) ; a 
输入 序列 一 | eee (OO 符号 编码 器 压缩 后 的 序列 B 
f(n) 
f(n) fin) 


é(n) f(n) 
压缩 后 的 序列 — oma 解压 缩 后 的 序列 
iol sm | 


图 841 i oie (a) 编码 器 ; (b) 解码 器 
为 了 接纳 量化 步骤 的 加 入, 必须 更 改 图 8.33 (a) 中 的 无 误差 编码 器 ,以便 由 编码 器 和 解码 器 产生 的 
预测 相等 。 如 图 8.41 (a) 所 示 , 这 是 通过 在 反馈 环 中 放置 一 个 有 损 编码 器 的 预测 器 来 完成 的 ， 其 中 表示 
yf (n) 的 输入 是 过 去 的 预测 函数 与 相应 的 量化 误差 产生 的 ， 
f(n) = &(n)+ f(n) (8.2-38) 
式 中 ，f(n) 同 以 前 所 定义 的 一 样 ,。 这 个 闭环 结构 可 以 防止 在 解码 器 的 输出 处 形成 误差 . 注意 , 在 图 8.41 (b) 
中 ， 解 码 需 的 输出 也 由 式 (8.2-38) 给 出 。 


例 8.23 入 调制 。 a 
A 调制 (DMD) A se 编码 


ZK, ee ee 
j=of (n-1) 7 (8.2-39) 





+6, e(n)>0 
ne EC (8.2-40) 


RH, a 是 一 个 预测 系数 (通常 小 于 1), CHE a fe 
F842 (a) ] i, RIBAL (a he Beas ii vei. Tu Dai 1ieaiek. 










28, 27, 27, 29, 37, 47, 62, 75, 77, 78, 79, £0, 81, 81, 82, 82},a=1, a 
程 从 第 一 个 样本 无 误差 地 输入 到 解码 器 中 开始 。 编码 器 和 解码 器 处 设 5 0)= f(0)=14, 7] 
以 通过 反复 用 式 (8.2-39) 、 式 (8.2-30) 、 式 (8.2-40) 和 式 (8.2-38) 计算 出 其 AM. BORE, GN, Yn = 1 
时 , RAT #1) =(1)(14) = 14, e(1) = 15-14=1, 61) =+65 [AH e(1) > 0], jo- 6.4+ 14= 20.5, 得 到 的 重 
建 误差 是 (15 — 20.5) 或 -5.5。 

图 8.42 (b) 以 图 形 方式 显示 了 图 8.42(c) 中 的 图 表 化 数据 显示 了 输入 和 完全 解码 后 的 输出 [ 即 f/(n) 和 
Fn) ] 注意 , 在 从 n= 14 到 19 的 这 一 快速 变换 区 域 中 , ¢ 太 小 而 不 足以 表示 输入 的 最 大 变化 ， 产 生 了 称 
为 儿 率 过 载 的 失真 。 此 外 ， 当 忆 太 大 而 无 法 表示 输入 的 较 小 变化 时 ， 如 在 从 n=0 到 n=7 的 相对 平滑 的 区 
域 中 ， 出 现 了 颗粒 噪声 。 在 图 像 中 ， 这 两 种 现象 会 导致 模糊 的 物体 边缘 和 颗粒 表面 或 噪声 表面 ( 即 失真 的 
平滑 区 域 ) 。 


成 了 表格 。 该 处 理 过 
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e(n) 








e(n) i i f(n) — f(n) 








1.0 
—6.5 
1.0 


8.5 
10.0 
13.5 
22.0 
28.5 
24.0 














图 8.42 A 调制 的 一 个 例子 


前 例 中 提 到 的 失真 对 所 有 形式 的 有 损 预 测 编码 都 很 普遍 。 这 些 失 真 的 严重 性 取决 于 所 用 量化 和 预 
测 方法 之 间 的 一 个 相互 作用 的 复杂 集合 。 先 不 管 它们 相互 间 的 作用 ， 预 测 器 通常 是 在 无 量化 误差 的 假 
设 之 下 设计 的 ， 并 且 量 化 器 设计 为 使 其 自身 的 误差 最 小 。 也 就 是 说 ， 预 测 器 和 量化 器 是 彼此 独立 进行 
设计 的 。 





最 佳 预 测 器 
在 多 数 预 测 编 码 应 用 中 ， 选 择 使 编码 器 的 均 方 预 测 误差 最 小 的 预测 器 
Efe (n)} = e| f(n)- im} (8.2-41) 
约束 条 件 为 
f(n) =&(n)+ f(n) = e(n)+ f(n) = f(n) (8.2-42) 
m , 
Fn) = of (ni) (8.2-43) 
i=] 


也 就 是 说 ， 最 佳 的 准则 是 最 小 均 方 预测 误差 ， 量 化 误差 假设 是 可 以 忽略 的 [ e(n) = e(n) ]， 且 预测 被 约 
束 为 前 m 个 样本 的 一 个 线性 组 合 *。 这 些 约 束 并 不 是 本 质 的 ， 但 它们 在 相当 程度 上 简化 了 分 析 ， 同 时 
降低 了 预测 器 计算 的 复杂 性 。 如 此 得 到 的 预测 编码 方法 称 为 差分 脉冲 编码 调制 (DPCM) 。 

在 这 些 条 件 下 ， 最 佳 预测 器 设计 问题 就 简化 成 了 相对 简单 地 选择 关 个 预测 系数 ， 这 些 系数 使 表达 式 


D 符号 Ef} 代表 统计 期 望 算 子 。 
@ 一 般 来 说 ， 一 个 非 高 斯 序列 的 最 佳 预测 器 ， 是 用 于 形成 估计 的 样本 的 一 个 非 线性 函数 。 
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£ 2 
Efe (n)} = ao 一 >》 win 一 D (8.2-44) 
i=l 


最 小 。 相 对 于 每 个 系数 ， 对 式 (8.2-44) 求 导 ， 并 令 导 数 为 零 ， 在 F(z) 具有 零 均值 和 方差 o? 的 假设 下 ， 
求 联 立方 程 的 解 ， 得 到 

a=R'r (8.2-45) 
式 中 ，R ”是 如 下 mxm AREA ERE 


E{f(n-Df(n-D} E{fn-Dfn-)} = BA-D7o-m} 
E{f(n-2)f(n-1)} oe 


ny | - | a 


E{f(n-m)f(n-1)} E{f(n—m)f(n-2)} -= E{f(n-m)f(n-m)} 
r 和 wx 是 六 元 向 量 : 


E{f(Wf(n-D)} a 
| EY mF MD}! a= K (8.2-47) 
E{f(n)f(n-m)} On 


因此 ， 对 于 任何 输入 序列 ， 使 式 (8.2-44) 最 小 的 系数 可 以 通过 一 系列 基本 矩阵 操作 来 确定 。 此 外 ， 这 
些 系 数 仅 取决 于 原 序列 中 样本 的 自 相 关 。 使 用 这 些 最 佳 系数 得 到 的 预测 误差 的 方差 为 


o =0,-a'r=0° -F Elf f(n-i}a, (8.2-48) 
i=l 


尽管 计算 式 (8.2-45) 的 机 理 非常 简单 ， 但 形成 R 和 + 所 需 的 自 相 关 计 算 实 现 起 来 却 非常 困难 ， 因 
此 ， 在 实践 中 几乎 从 不 使 用 局 部 预测 ( 即 在 这 些 预测 中 对 每 个 输入 序列 计算 预测 系数 ) 。 在 大 多 数 情况 
F, 通过 假设 一 个 简单 的 输入 模型 ， 并 将 相应 的 自 相关 代入 式 (8.2-46) 和 式 (8.2-47) ( 见 8.1.4 节 ) 来 计算 
一 组 全 局 系数 。 璧 如， 假设 带 有 可 离 分 自 相 关 函 数 的 二 维 马 尔 可 夫 图 像 源 ( 见 8.1.4 节 ) 


E{ f(x, yf(x-i, y- D} =o ppl (8.2-49) 
和 广义 四 阶 线性 预测 器 
F(x y=a,f(x, y-l) +a,f(x-1, y-lI) +a, f(x-1, y)+a,f(x-1, y+1) (8.2-50) 
得 到 的 最 佳 系数 是 
ii = Pps Oy FAP, Pyr Cy =P Oe =9 (8.2-51) 


IF, o, 和 pp, 分 别 是 所 研究 图 像 的 水 平和 垂直 相关 系数 。 
最 后 ， 通 常 要 求 式 (8.2-43) 中 的 预测 系数 之 和 小 于 等 于 1， 即 


da, <1 (8.2-52) 
i=l 


这 种 限制 是 为 了 确保 预测 器 的 输出 落 入 人 允许 输入 范围 内 , 并 减少 传输 噪声 的 影响 [ 当 输入 到 图 8.41 (a) 中 的 
是 一 幅 图 像 时 ， 传 输 噪 声 在 重建 图 像 中 通常 表现 为 水 平 条 纹 ]。 降 低 DPCM 解码 器 对 输入 噪声 的 
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敏感 性 很 重要 ， 因 为 单个 误差 (在 适当 的 环境 下 ) 会 传播 到 以 后 的 所 有 输出 中 ， 也 就 是 说 ， 解 码 器 
的 输出 会 变 得 不 稳定 。 通 过 进一步 限制 式 (8.2-52) 严格 小 于 1， 可 将 输入 误差 的 影响 限制 在 少量 的 
输出 中 。 


例 8.24 ”预测 技术 的 比较 。 
考虑 由 对 图 8.9(a) 中 的 单 色 图 像 进 行 DPCM 编码 产生 的 预测 误差 ， 假 设 量化 误差 为 零 卓 使 用 如 下 4 
个 预测 器 : i 


F(x, y)=0.97 f(x, ¥-D (8.2-53) 

A(x, y)=0.5 f(x, y-1)+0.5f(x-1, y) muh (8.2-54) 

F(x, y)=0.75 f(x, yD)+0.75f( -by)-05f(-by-D) (8.2-55) 
_{097f(%,y-1), Ah <Av | 

f(x,y)= to O7 Fle Ly} 0 BH (8.2-56) 


AH, Ah=|f@- Ly)-f(x-l »y-1)| MAv=|f(x,.y-)-f(x-Ly-Dy 表示 在 点 Cr ERIK EATE EE 
BE, xt (8.2-53) Bist (8.2-56) EXT a, 的 一 个 相对 鲁 棒 的 集合 ， 该 集合 可 对 很 宽 范围 的 图 像 提供 令 人 满意 
的 性 能 。 设 计 式 (8.2-56) 的 自 适应 预测 器 的 目的 是 ， sf ASE Fav), 并 
选择 适合 特定 度量 性 能 的 预测 器 来 改善 边缘 的 重 现 质量 。 

18.43 (a) 33) (d) 显示 了 使 用 式 (8.2-53) 到 式 (8.2-56) 的 预测 器 得 到 的 预测 误差 图 像 。 注 意 ， 随 着 预测 器 
阶 数 的 增加 明显 ,可 觉察 的 误差 减少 了 "。 预测 误差 的 标准 差 遵 循 类 似 的 模式 ， 它 们 分 别 是 11.1, 9.8, 9.1 和 
9.7 个 灰 度 级 。 


ge 6c; 


图 8.43 4 种 线性 预测 技术 的 比较 
最 佳 量化 
图 8.44 中 的 阶梯 量化 函数 1:=g(s) Æ s 的 奇 函 数 [ BY g(-s)=—-q(s) |, 这 个 函数 完全 可 以 由 图 8.44 
第 一 象限 中 所 示 的 s; 和 的 5/2 个 值 来 描述 。 这 些 断 点 定义 了 函数 的 不 连续 性 ， 并 称 为 该 量化 器 的 判决 
级 和 重建 级 。 为 方便 起 见 ， 如 果 s 位 于 半 开 区 间 (s ,s  ] 内 ， 则 可 以 将 s 视 为 到 t 的 映射 。 
量化 器 设计 问题 是 对 于 一 种 特殊 的 最 佳 准则 和 输入 概率 密度 函数 p(s) ， 选 择 最 好 的 s Fle, 。 如 果 
最 佳 准 则 (可 以 是 统计 度量 或 心理 视觉 度量 ) 是 均 方 量化 误差 [ 即 Ef(s; -1,)°} ] 最 小 ,并 且 p(s) 是 一 


个 偶 函 数 ， 则 最 小 误差 (Max[1960]) 的 条 件 是 
JG —t,)p(s)ds =0, i=1, 2E (8.2-57) 


D 使 用 多 于 3 个 或 4 个 像素 的 预测 器 ， 会 提供 很 少 的 压缩 增益 .但 复杂 性 却 会 增加 (Habibi[1971]) 。 
D 关于 心理 视觉 度量 的 详细 内 容 ， 请 参阅 Netravali[1977] 和 Limb and Rubinstein[1978]。 
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0, i=0 
s= iHa, P=t, Ye Ll (8.2-58) 
20, i=L/2 
All 
S4 =-S,,t, =t; (8.2-59) 


式 (8.2-57) 指 出 重建 级 是 规定 的 判决 区 间 上 p(s) 下 方面 积 的 质心 ， 而 式 (8.2-59) 指 出 判决 级 是 重 
建 级 之 间 的 一 半 。 式 (8.2-59) 是 g 为 一 个 奇 函 数 的 结果 。 对 于 任意 工 , 满足 式 (8.2-57) 到 式 (8.2-59) 
的 s, 和 tt 在 均 方 误差 意义 址 是 最 佳 的 ; 相应 的 
量化 器 称 为 工 级 劳 埃 德 -马克 斯 (Lloyd-Max) È 
化 器 。 

表 8.12 列 出 了 单位 方差 拉 普 拉 斯 概率 密度 函 
数 [ 见 式 (8.2-35) ] 的 2 级 、4 级 和 8 级 劳 埃 德 - 
马克 斯 判决 和 重建 级 。 因 为 对 大 多 数 非 平凡 的 
P(s) 来 说 , 得 到 式 (8.2-57) 到 式 (8.2-59) 的 显 式 或 
闭合 形式 的 解 很 困难 ， 所 以 这 些 值 都 是 数值 生成 
的 (Paez and Glisson[1972]) 。 所 示 的 这 三 个 量化 器 
分 别提 供 了 1,2 和 3 比特 /像素 的 固定 输出 速率 。 
由 于 表 8.12 是 对 单位 方差 分 布 构建 的 ,所 以 cz=1 wb tala 
情况 的 重建 级 和 判决 级 ， 是 将 概率 密度 函数 的 标 





1 
1 
1 
1 
1 
1 






2 S$(L/2)-1 


输入 


准 差 与 表 中 的 值 相 乘 得 到 的 。 表 中 的 最 后 一 行列 图 8.44 一 个 典型 的 量化 函数 
出 了 步 长 0, 步 长 8 同时 满足 式 (8.2-57) 到 式 (8.2-59) 和 附加 的 约束 条 件 : 
f-t =8,-s,_, =0 (8.2-60) 


如 果 采 用 变 长 编码 的 符号 编码 器 作 为 图 8.41 (a) 中 的 普通 有 损 预 测 编码 器 , 则 步 长 为 9 的 最 佳 均匀 量化 
器 (对 拉 普 拉 斯 PDF) 所 提供 的 码 率 ， 将 低 于 具有 相同 输出 保 真 度 的 定 长 编码 劳 埃 德 - 马 克 斯 量化 器 所 
提供 的 码 率 (O’Neil[1971]) 。 


表 8.12 单位 方差 拉 普 拉 斯 概率 密度 函数 的 劳 埃 德 -马克 斯 量化 器 





尽管 劳 埃 德 -马克 斯 和 最 佳 均匀 量化 器 不 是 自 适应 的 , 但 以 图 像 的 局 部 特性 为 基础 来 调整 量化 
级 别 好 处 更 多 。 理 论 上 , 缓慢 变化 的 区 域 可 被 精细 量化 ， 而 快速 变化 的 区 域 可 被 更 为 粗糙 地 量化 . 
这 种 方法 可 以 同时 降低 颗粒 噪声 和 斜率 过 载 ， 而 在 码 率 上 仅 要 求 极 小 的 增加 。 代 价 是 增加 了 量化 
器 的 复杂 性 。 
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8.2.10 ”小 波 编码 
类 似 于 8.2.8 节 的 变换 编码 技术 ， 小 波 编码 基于 以 下 概念 : 对 图 像 


像素 解除 相关 的 变换 系数 进行 编码 ， 比 对 原 图 像 像素 本 身 进行 编码 的 
效率 更 高 。 如 果 变 换 的 基 函 数 〈 此 时 为 小 波 函数 ) 将 大 多 数 重要 的 可 bic 


视 信 息 包装 到 少量 系数 中 ， 则 剩 下 的 系数 可 被 粗略 地 量化 或 截取 为 零 ， 而 图 像 几乎 没有 失真 。 

图 8.45 显 示 了 一 个 典型 的 小 波 编码 系统 。 为 了 对 一 幅 大 小 为 2x2“ 的 图 像 进行 编码 , 选择 一 种 分 析 
ANKE y 和 最 小 分 解 级 别 J — P, 并 用 于 计算 图 像 的 离散 小 波 变换 。 如 果 小 波 具 有 互补 的 尺度 函数 gp, 则 
可 以 使 用 快速 小 波 变 换 ( 见 7.4 节 和 7.5 节 ) 。 不论 哪 种 情况 , 计算 出 来 的 变换 都 会 将 原 图 像 的 大 部 
分 转换 为 水 平 、 垂 直 和 对 角 分 解 系数 , 这 些 系数 具 有 零 均值 和 类 似 拉 普 拉 斯 分 布 。 回 顾 图 7.1 中 的 
图 像 和 图 7.10 (a) 中 图 像 的 小 波 变换 的 较 简单 的 统计 ， 由 于 许多 计算 的 系数 携带 很 少 的 视觉 信息 ， 这 
些 系数 可 以 最 小 的 系数 和 编码 元 余 来 量化 和 编码 。 此 外 ， 量 化 可 以 自 适应 地 越过 PP 分 解 级 别 而 利用 任 
何 位 置 相关 。 一 种 或 多 种 无 损 编码 方法 ， 如 行程 编码 、 霍 夫 曼 编码 、 算 术 编 码 和 比特 平面 编码 等 ， 都 
可 以 应 用 到 最 后 的 符号 编码 步 又 中 。 解 码 可 以 用 与 编码 相反 的 操作 来 实现 一 一 量化 过 程 除外 ， 因 为 量 
化 过 程 不 可 能 严格 逆向 执行 。 


a 
b Waag 小 波 变换 量化 器 压缩 后 的 图 像 
压缩 后 的 图 像 符号 解码 器 小 波 反 变 换 解压 缩 后 的 图 像 


图 8.45 小 波 编码 系统 : (a) 编码 器 ; (b) 解码 器 


图 8.45 中 基于 小 波 的 系统 与 图 8.21 中 的 变换 编码 系统 之 间 的 主要 差别 是 ， 省 略 了 变换 编码 器 的 子 图 
像 处 理 阶段 。 因 为 小 波 变 换 的 计算 效率 和 固有 的 局 部 性 ( 即 小 波 的 基 函 数 在 宽度 上 是 有 限 的) , 对 原 图 像 进 
行 细 分 是 没有 必要 的 。 稍 后 我 们 会 看 到 ， 细 分 步骤 的 取消 可 以 消除 块 效应 ， 这 种 效应 正 是 以 DCT 为 基 
础 的 近似 图 像 在 高 压缩 比 下 的 特性 。 

小 波 的 选择 

为 图 8.45 中 正 变换 和 北 变 换 的 基 所 选择 的 小 波 ， 影 响 着 小 波 编码 
系统 的 设计 和 性 能 的 各 个 方面 。 它 们 直接 影响 到 变换 的 计算 复杂 性 ， er 
或 间接 影响 压缩 和 重建 具有 可 接受 误差 的 图 像 系统 的 能 力 。 当 变换 小 | ey pene ce 
波 带 有 一 个 尺度 函数 时 ， 变 换 可 以 通过 一 系列 数字 滤波 操作 来 实现 。 
滤波 器 抽 头 的 数量 等 于 非 零 小 波 和 尺度 向 量 系数 的 数量 。 小 波 将 信息 包装 到 较 少 变换 系数 中 的 能 力 ， 
取决 于 小 波 的 压缩 和 重建 性 能 。 

基于 小 波 的 压缩 广泛 使 用 的 展开 函数 是 Daubechies 小 波 和 双 正 交 小 波 。 后 者 允许 将 有 用 的 分 析 特 
性 ， 如 零 矩 的 数量 ( 见 7.5 节 ) 合并 到 分 解 滤波 器 中 ,而 将 重要 的 综合 特性 ， 如 重建 的 平滑 度 ， AE 
建 滤波 器 中 。 

.25 TE Ee E 
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波 和 图 8.46(c) 中 使 用 的 对 称 小 波 ， 它 们 是 具有 增加 对 称 性 的 Daubechies 小 波 的 一 种 扩展 。 在 图 8.46(d) 中 使 用 
的 Cohen-Daubechies-Feauveau 小 波 用 于 说 明 双 正 交 小 波 的 性 能 。 如 以 前 的 这 类 结果 那样 ， 所 有 细节 系数 都 进 
行 了 标定 ， 以 便 使 基本 结构 更 为 突出 一 一 灰 度 128 对 应 于 系数 值 0。 

如 表 8.13 所 示 ， 从 图 8.46 (a) 移 到 图 8.46 (0i, F 8.46 中 变换 的 计算 所 涉及 的 操作 次 数 ， 从 每 个 系 
数 ( 对 于 每 个 分 解 级 别 ) 的 4 次 乘法 和 加 法 增加 到 28 次 乘法 和 加 法 。 所 有 4 个 变换 都 使 用 二 种 快速 小 波 变 
换 ( 即 滤波 器 组 ) 公 式 进行 计算 。 注 意 ， 当 计算 的 复杂 性 ( 即 滤波 器 抽 头 的 数量 ) 增 加 时 ， 信 息 包装 性 能 也 会 
更 好 。 采用 哈 尔 小 波 且 小 于 1.5 的 细节 系数 被 截 短 为 零 时 ， 总 变换 的 33. 8% 也 都 为 堆 。 IE 
交 小 波 ， 被 置 零 的 系数 的 数量 增加 到 42.1%， 洪 在 压缩 率 提升 了 近 10%。 





图 8.46 图 8.9(a) 关 于 (a) 险 尔 小 波 、(b) Daubechies 小 波 、-(c) 对 称 小 波 和 
(d) Cohen-Daubechies-Feauveau 双 正 交 小 波 的 三 尺度 小 波 变换 


表 8.13 将 图 8.46 中 细节 系数 小 于 1.5 的 变换 截 短 为 零 时 ， 小 波 变 换 滤 波 器 的 抽 头 和 置 零 系 数 


滤波 器 抽 头 (尺度 + 小 波 ) 











哈 尔 小 波 ( 见 习题 7.10) 
Daubechies 小 波 ( 见 图 7.8) 
对 称 小 波 ( 见 图 7.26) 

双 正 交 小 波 ( 见 图 7.39) 


分 解 级 别 选取 
另 一 种 影响 小 波 编码 计算 复杂 性 和 重建 误差 的 因素 是 变换 分 解 级 别 的 数量 。 由 于 尸 尺度 快 速 小 波 
变换 涉及 尸 个 滤波 器 组 的 迭代 , 正 变换 和 反 变 换 计 算 中 的 操作 次 数 会 随 分 解 级 数 的 增加 而 增加 。 此 外 ， 
对 更 大 分 解 级 别 导致 的 逐渐 增 大 的 低 尺 度 系数 的 量化 ， 会 影响 重建 图 像 中 逐渐 增 大 的 区 域 。 在 许多 应 
图 用 中 ， 如 搜索 图 像 数 据 库 或 逐渐 重建 传送 图 像 等 ， 所 存储 或 传送 图 像 的 分 辩 率 和 最 低 可 用 近似 的 尺度 
通常 决定 了 变换 级 别 的 数量 。 


33.8% 
40.9% 
41.2% 
42.1% 
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表 8.14 对 图 8.9(a) 中 大 小 为 512x512 的 图 像 进行 小 波 编码 时 分 解 级 别 的 影响 
ER 


256x256 
128x128 
64x64 
32x32 
16x16 


3.27 
4.23 
4.54 
4.61 


a bk WN 


量化 器 设计 

影响 小 波 编码 压缩 和 重建 误差 的 最 重要 因素 是 系数 量化 。 尽 管 最 广泛 使 用 的 量化 器 是 均匀 的 ， 
但 量化 的 效果 可 以 通过 以 下 方法 进一步 改进 : 1) 引入 一 个 以 零 为 中 心 的 较 大 量化 间隔 , 称 为 死 区 ， 
或 2) 从 一 个 尺度 到 另 一 个 尺度 自 适应 调整 量化 间隔 的 大 小 。 不 论 哪 种 情况 ,选择 的 量化 间隔 都 必 
须 随 着 编码 图 像 的 比特 流传 送 给 解码 器 。 间 隔 本 身 可 根据 被 压缩 的 数字 信号 的 能 量度 量 是 样本 平方 
图 像 试 探 来 决定 或 自动 地 计算 。 例 如 ， 一 个 全 局 系数 闭 值 可 作为 第 
一 级 细节 系数 的 绝对 值 的 中 值 ， 或 作为 被 截 短 的 零 的 数量 和 重建 图 
像 中 保留 的 能 量 数量 的 函数 来 计算 。 









97.918% 


WARAN) 
均 方 根 误差 ( 灰 度 级 ) 





0 2 4 6 8 10 12 14 16 18 
TEER BRE 


图 8.47 和 死 区 间隔 的 选择 对 小 波 编码 的 影响 
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图 847 SE a A TA 处 从 0 增 大 到 1.9444) 
aj 3. 83 个 灰 度 级 ;在 这 一 点 零 的 数量 达到 93.85% 
升 约 4%) ， 则 重建 误差 会 增加 到 123 个 灰 度 级 。 


JPEG-2000 


JPEG-2000 扩充 了 流行 的 JPEG 标准 ， 在 连续 色调 静止 图 像 的 压缩 和 压缩 数据 的 访问 方面 提供 了 
更 大 的 灵活 性 。 例 如 ， 可 以 提取 JPEG-2000 压缩 图 像 中 的 一 部 分 进行 转发 、 存 储 、 显 示 和 /或 编辑 。 该 
标准 以 刚刚 讨论 的 小 波 编码 技术 为 基础 。 系数 量化 与 单一 尺度 和 子 带 相 适 应 , 并 且 在 比特 平面 ( 见 8.2.7 
节 ) 的 基础 上 对 量化 后 的 系数 进行 算术 编码 。 使 用 标准 符号 ， 一 幅 图 像 可 以 进行 如 下 编码 
(ISO/TEC[2000}) 。 

编码 过 程 的 第 一 步 是 ， 通 过 减 去 2 ， 对 被 编码 的 Ssiz 比特 的 无 符号 图 像 的 样本 进行 直流 电 平 
平移 。 如 果 该 图 像 具 有 多 于 一 个 的 分 量 〈 如 彩色 图 像 的 红色 、 绿 色 和 


蓝 色 平面 )， 则 单独 平移 每 个 分 量 。 如 果 恰 好 有 三 个 分 量 ， 则 可 使 用 一 
个 可 道 的 或 非 可 逆 的 线性 组 合 ， 来 对 它们 有 选择 地 进行 去 相关 处 理 。 | 
例如 ， 标 准 中 非 可 逆 的 分 量变 换 是 


W(x, y) =0.2991,(x, y) + 0.5871, (xz y)+0.1141,(x, y) 
Y (x, y) =—0.16875/)(x, y)— 0.331267, (x, y)+0.57, (x, y) (8.2-61) 
y(x, y) =—0.51)(x, vy) — 0.418697, (x, y)— 0.081317, (x, y) 


式 中 , Lo, hF DERIFRA E, Yo, Yi AA Yo FERAL 


量 。 如 果 输 入 分 量 是 彩色 图 像 的 红色 、 绿 色 和 蓝 色 平 面 ， 则 式 (8.2-61) 用 | 不可逆 分 量变 换 是 用 于 有 损 压 缩 的 
Y'C,C, 的 彩色 视频 变换 近似 R'G'B' (Poynton[1996]) >. 变换 的 目的 是 改 pices i Weegee 
善 压缩 效率 ; 变换 后 的 分 量 已 和 五 是 差 值 图 像 ， 该 差 值 图 像 的 直方 图 


在 零点 附近 有 很 高 的 峰值 。 

图 像 进 行 了 级 别 平 移 和 选择 性 去 相关 处 理 后 ， 其 分 量 可 被 分 为 多 个 像 块 。 这 些 像 块 是 被 单独 处 
理 的 像素 的 矩形 阵列 。 因 为 一 幅 图 像 可 有 多 个 分 量 ( 即 它 可 预 分 为 三 个 彩色 分 量 ) ， 因 此 ， 像 块 处 理 
生成 了 块 分 量 。 每 个 像 块 分 量 可 以 独立 地 重建 ， 这 种 处 理 为 存 取 和 /或 加 工 编 码 图 像 的 有 限 区 域 提供 
了 一 种 简单 的 机 制 。 例 如 ， 宽 高 比 为 16 : 9 的 图 像 可 被 分 为 多 个 宽 高 比 为 4 : 3 的 像 块 。 然 后 ,该 像 
块 可 以 不 用 访问 压缩 图 像 的 其 他 像 块 就 可 重建 。 如 果 该 图 像 未 被 细 分 为 多 个 像 块 ， 它 就 是 一 个 单一 
的 像 块 。 

然后 ， 计 算 每 个 像 块 分 量 的 行 和 列 的 一 维 离散 小 波 变换 。 对 于 无 误差 压缩 ， 这 种 变换 是 以 双 
正 交 、5-3 系数 尺度 -小 波 向 量 (Le Gall and Tabatabai[1988]) 为 基础 的 。 对 于 非 整数 值 变换 系数 ,还 
定义 了 一 个 四 舍 五 和 过程, 在 有 损 应 用 中 , 采用 9-7 系数 尺度 -小 波 向 量 (Antonini, Barlaud, Mathieu 
and Daubechies[1992]) 。 无 论 哪 种 情况 ， 都 是 使 用 7.4 节 的 快速 小 波 变换 或 通过 一 种 基于 提升 的 方法 
进行 计算 的 (Mallat[1999]) 。 例如 , 在 有 损 应 用 中 , 用 于 构造 9-7 FWT 分 析 滤 波 器 组 的 系数 在 表 8.15 
中 给 出 。 互 补 的 基于 提升 的 实现 涉及 6 种 顺序 “提升 ”和 “尺度 ”操作 : 










62 a e EA 
D R'G'B' 是 线性 CIE (国际 照明 委员 会 )RGB REAPS GRE ER ERAS. YEE, C, Ail CG, 是 色差 ( 即 8'-Y' 和 
- R' -Y' 经 标定 后 的 值 ) 。 
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¥(2n+1)=X(2n+1)+a[X(2n)+ X(2n+2)], io—3 <2n+1<i, +3 
Y(2n) = X(2n) + B[Y(2n-1)+ Y(2n+])], ip —2 <2n<i, +2 
¥(2n+1)=Y¥(2n+1)+y[¥(2n)+Y¥(2n+2)], ig -1 <2n+1 <i, +1 


(8.2-62) 
Y(2n) = ¥(2n)+6[Y¥(2n-1)+¥(2n+1)], ip <2n <i, 
Y(2n+1)=-K-Y(2n +1), iy <2n+1<i, 
Y¥(2n) =¥(2n)/K, iy <2n<i, 


表 8.15 ASAT 9-7 小 波 变 换 的 低 通 和 高 通 分 析 深 波 器 的 冲 激 响应 


高 通 小 波 系数 
-1.115 087 052 456 994 
0.591 271 763 114247 0 






低 通 尺度 系数 
0.602 949 018 236 3579 
0.266 864 118 442 8723 
—0.078 223 266 528 987 85 
—0.016 864 118 442 874 95 
0.026 748 757 410 809 76 


式 中 , XX 是 变换 的 像 块 分 量 , 了 是 变换 结果 ,i 和 i 定义 了 分 量 内 的 像 块 分 量 的 位 置 。 也 就 是 说 ,它们 
是 变换 像 块 分 量 的 行 或 列 的 第 一 个 取样 及 紧 接 着 的 下 一 个 取样 的 索引 。 变 量 n SEF iy, 1 假定 和 执行 的 


6 个 操作 值 。 如 果 n< 避 或 n > i,, 则 Xm 通过 对 称 地 扩充 来 得 到 。 
例如 , XCig 1) = X(ig + 1), XCig—2) = X(ig + 2), Ai) =X, 2), Ait) | 指定 的 。 
=X(ii 一 3)。 提 升 和 尺度 操作 的 结果 ,了 的 偶 索 引 值 等 于 FWT 低 通 滤波 
后 的 输出 ;而 了 的 奇 索引 值 对 应 于 高 通 FWT 滤波 后 的 结果 ,提升 参数 a, p, y 和 56 分别 为 -1.586 134 342, 
-0.052 980 118, 0.882 911 075 和 0.433 506 852。 尺 度 因 子玉 为 1.230 174 105. 

isis iii 4 个 子 带 ， 分 别 是 像 块 分 量 的 低 分 辩 率 近似 及 分 量 的 水 平 、 垂 直 和 对 角 频 率 
特征 。 将 后 续 和 迭代 限制 为 前 面 的 分 解 的 近似 系数 ， 把 该 变换 
zy) (u, v) Wee v) 重复 N; 次 ， 可 以 得 到 一 个 


7 章 可 知 ,DWT 将 一 幅 图 像 
A RACER, MARE 
以 2 的 寡 次 空间 相 联系 ,并 


是 最 低 尺 度 仅 包含 显 式 定义 的 原始 像 块 分 量 的 近似 。 如 在 图 
8.48 中 推测 的 那样 ， 这 里 总 结 了 N=2 时 的 JPEG-2000 标 准 
的 符号 。 一 个 一 般 的 Ni 尺度 变换 包含 3N, +1 个 子 带 , 这些 
子 带 的 系数 对 于 b = NiLL, NHL, +++, 1HL, 1LH, 1HH 表示 
Ha, 。 该 标准 没有 规定 需要 计算 的 尺度 数量 。 

当 每 个 块 分 量 都 经 过 处 理 之 后 ， 变 换 系数 的 总 数 等 于 
原 图 像 中 的 取样 数 一 “但 重要 的 视觉 信息 集中 于 少数 系数 
图 8.48 JPEG-2000 二 尺度 小 波 变换 像 ” ”中 ,为 了 减少 表示 变换 所 需 的 比特 数 , 子 带 b 的 系数 a, (uv) 

块 分 量 系 数 符号 和 分 析 增 益 。 使 用 下 式 量化 为 值 % = (u,v) : 









0.057 543 526 228 495 57 
—0,091 271 763 114 249 48 
0 











q, (u, v)=sign[a,(u, v)]- noor Ete» (8.2-63) 
b 


AF, BEK A, 为 


633 
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A, =2% -5 [ +H) (8.2-64) 
2 


R 是 子 带 b 的 标定 动态 范围 ， 而 2& 和 心 是 分 配给 予 带 系数 的 指数 和 
尾数 的 比特 数 。 子 带 b 的 标定 动态 范围 是 用 于 表示 原 图 像 的 比特 数 和 
Pit b 的 分 析 增 益 比 特 数 之 和 。 子 带 分 析 增 益 比 特 遵 从 图 8.48 所 示 的 
简单 模式 。 例 如 ， 子 带 b=1HH 有 两 个 分 析 增 益 比特 。 

对 无 误差 压缩 ， 有 jy =0,R = s, 和 A 二 1。 对 不 可 逆 压 缩 ， 标 准 中 没有 指定 特定 的 量化 步 长 。 
相反 ， 必 须 以 子 带 为 基础 向 解码 器 提供 指数 和 尾数 的 比特 数 ， 这 称 为 解释 式 量化 ， 或 仅 针对 NLLL 子 
带 , 这 称 为 导出 式 量化 。 在 后 一 种 情况 下 , 对 余下 的 子 带 使 用 外 推 的 NLLL 子 带 参数 进行 量化 S so 和 
向 表示 分 配给 NLLL 子 带 的 比特 数 ， 则 子 带 b 的 外 推 参数 为 


Ha = Ho 
E, =& +n, —N, 
IF, n, 表示 从 原 图 像 像 块 分 量 到 子 带 b 的 子 带 分 解 级 别 的 数量 。 
在 编码 过 程 的 最 后 一 步 中 ， 每 个 变换 像 块 分 量 的 子 带 的 系数 被 排列 为 称 为 码 块 的 矩形 块 ， 这 些 码 
块 被 单独 编码 ， 一 次 一 个 比特 平面 。 从 带 有 非 零 元 素 的 最 高 阶 比特 平面 开始 ， 每 个 比特 平面 都 在 3 
个 通道 中 处 理 。 (比特 平面 中 的 ) 每 个 比特 仅 在 3 个 通道 之 一 中 被 编码 ， 这 3 个 通道 分 别称 为 有 效 性 传 
播 、 幅 度 细 化 和 提纯 。 然 后 ,对 输出 进行 算术 编码 ,并 对 其 他 码 块 使 用 相似 的 途径 进行 组 合 以 形成 层 。 
层 是 来 自 每 个 代码 块 的 编码 通道 的 任意 数量 的 组 合 。 得 到 的 层 最 终 被 分 割 成 包 ， 从 而 提供 从 总 码 流 中 
提取 感 兴趣 空间 区 域 的 附加 方法 。 
JPEG2000 解码 回 是 前 述 过 程 的 简单 反 操 作 。 重建 来 自 算术 编码 的 JPEG2000 包 的 块 分 量 
子 带 后 ， 用 户 选 择 的 一 些 子 带 来 解码 。 虽 然 对 于 特殊 子 带 编码 器 可 能 已 编码 M 个 比特 平面 ， 
但 由 于 码 流 的 嵌入 性 质 ,用 户 可 能 选择 只 解码 N, 个 比特 平面 ,这 相当 于 使 用 22% .A; 的 步 长 
来 量化 码 块 系数 。 所 有 未 解码 的 比特 都 置 为 零 ， 上 且 所 得 到 的 表示 为 现 (v) 的 系数 使 用 下 式 进 
行 反 量化 : 





(8.2-65) 


G,(u, v)tr:2 e) As, Tu, v) >0 
R, (u, v) =4 (Gu, v=r-2 Nr) -A,, g, v) <0 (8.2-66) 
0, q,(u, v) =0 


RH, R, (u, 号 表示 一 个 反 量 化 的 变换 系数 ， 而 Mu YET, (uy) f 

已 解码 比特 平面 数 .重建 参数 "通过 产生 最 好 视觉 或 客观 重建 质量 的 解 | AEO E 
码 器 来 选择 。 通 常 ，0 < x <1， 常 用 值 为 12。 然 后 ， 反 量化 系数 使 用 “| 损失 。 除 不 可 逆 PEG-2000 压缩 情形 
一 个 FWT- 滤波 器 组 按 列 和 按 行进 行 逆 向 变换 ， 这 些 系 数 根据 表 8.15 |Om 0R =a =1) 外 ,该 





Ast (7.1-11) 或 通过 下 列 基于 提升 的 操作 得 到 : és 
X(2n)=K-Y(2n), iy -—3 S2n <i, +3 
X(2n+1)=(-1/K)-Y(2n+)), 四 一 2 S2n-1<i,+2 
X(2n) = X(2n)-d[X(2n-1)+X(2n+)], iy -3 <2n<i, +3 


(8.2-67) 


X(2n+1) =X (2n+1)—y[X(2n) + X(2n+2)], iy -2 S2n+1 <i, +2 
X(2n) = X(2n)- B[X(2n-1)+X(2n+l)], iy -1 S2n<i, +1 
X(2n+1) =X (2n+1)—a[X(2n)+X(2n+2)], i <2n+1 <i, 
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式 中 , 参数 w 有 8 六 5 和 天 的 定义 与 式 (8.2-62) 中 的 相同 。 反 量化 后 的 系数 行 或 列 元 素 Y(n) 在 需要 时 可 以 


对 称 扩展 。 解 码 的 最 后 一 步 是 分 量 像 块 的 组 合 ， 反 向 分 量变 换 (如 果 需 要 的 话 ) 和 直流 (DC) 水 平平 移 。 
对 于 不 可 逆 编 码 ， 分 量 反 变换 是 
In (x, y) = Yo (x, y)+1.402Y, (x, y) 
I(x, y) =% (x, v)—0.34413Y,(x, v)—0.71414Y, (x, y) (8.2-68) 
I, (x, y)=% (x, y) + 1.772Y (x, Y) 
变换 后 的 像素 被 平移 了 了 +2 。 
例 8.28 ”基于 小 波 的 JPEG-2000 编码 与 基于 DCT 的 JPEG 压缩 的 比较 。 
图 8.49 显示 了 图 8.9 (a) 中 单 色 图 像 的 4 幅 JPEG-2000 近似 。 图 中 相继 各 行 说 明 压缩 水 平 递增 一 包 
括 C=25, 52,75 和 105. 第 一 列 图 像 是 JPEG-2000 编码 解压 缩 后 的 结果 ,这 些 图 像 与 原 图 例 见 图 8.9 (a) ] 
的 差 示 于 第 二 列 , 第 三 列 包 含 了 第 二 列 重建 图 像 的 局 部 放大 部 分 。 因 为 前 两 行 的 压缩 率 与 例 8.18 中 的 压缩 
率 相同 ,这些 结果 可 以 与 图 8.32 (a) 到 (中 基于 JPEG 变换 的 结果 进行 定性 和 定量 比较 。 





图 8.49 图 89(a) 的 4 幅 JPEG-2000 近似 。 每 一 行 均 包 含 了 压缩 和 重建 后 的 结 
果 、 该 结果 与 原 图 像 间 经 过 缩放 的 差 值 图 像 ， 以 及 重建 图 像 的 局 部 放 
大 部 分 (请 将 第 一 行 和 第 二 行 与 图 8.32 中 的 JPEG 结果 进行 比较 ) 


图 8.49 第 一 行 和 第 二 行 中 的 误差 图 像 与 图 8.32(b) 和 (e) 中 对 应 图 像 的 视觉 比较 表明 , JPEG-2000 结果 中 
的 误差 明显 减 小 一 一 JPEG 结果 的 误差 分 别 为 5.4 个 灰 度 级 和 10.7 个 灰 度 级 ,而 JPEG-2000 的 误差 分 别 为 3.86 
个 灰 度 级 和 5.77 个 灰 度 级 。 在 这 两 种 压缩 水 平 上、 计算 的 误差 有 利于 基于 小 波 的 结果 。 除了 降低 重建 误差 
外 ,小 波 编 码 引 人 注 目地 增强 了 图 像 的 质量 (在 主观 感觉 上 ) ,注意 ,JPEG 结果 中 明显 的 块 效应 [ 见 图 8.32 (c) 
HIO ] 在 图 8.49 中 并 不 存在 。 最 后 ， 我 们 注意 到 ， 图 849 中 第 三 行 和 第 四 行 所 能 达到 的 压缩 用 JPEG 并 不 
实际 。JPEG-2000 可 提供 压缩 率 超过 100 : 1 的 可 用 图 像 一 -最 讨厌 的 降 质 就 是 图 像 模 糊 的 增加 。 . 





ww 


636 
638 


394 数字 图 像 处 理 ( 第 三 版 ) 


8.3 ”数字 图 像 水 印 


8.2 节 中 的 方法 和 标准 构成 了 图 像 ( 图 片 或 视频 ) 在 数字 媒体 和 互联 网 上 的 实际 发 布 。 遗 憾 的 是 ， 
这 样 发 布 的 图 像 可 被 重复 且 无 误差 地 复制 ， 这 就 把 它们 的 所 有 者 的 权利 置 人 风险 之 中 。 其 至 为 发 布 加 
密 后 ， 解 密 后 的 图 像 也 不 能 得 到 保护 。 阻 止 非法 复制 的 方法 之 一 是 ， 把 称 为 水 印 的 一 条 或 多 条 信息 项 
插入 到 易 受 攻击 的 图 像 中 ， 在 这 种 方法 中 ， 水 印 不 能 从 图 像 本 身分 离 出 来 。 如 同 水 印 图 像 的 整体 部 分 
那样 ， 它 们 以 各 种 方法 来 保护 所 有 者 的 权益 ， 包 括 : 


1. 版 权 识别 。 当 所 有 者 的 权益 受到 侵犯 时 ， 数 字 水 印 可 提供 作为 所 有 权证 据 的 信息 。 

2. 用 户 识别 或 指纹 。 合 法 用 户 的 身份 可 以 在 水 印 中 编码 ， 并 用 于 识别 非法 复制 源 。 

3. 著作 权 认定 。 水 印 的 存在 可 保证 一 幅 图 像 不 被 自 改 一 一 假定 水 印 被 设计 成 对 图 像 的 任何 修改 
都 将 破坏 水 印 。 

4. 自动 监视 。 水 印 可 以 通过 系统 来 监测 ， 系 统 可 在 任何 时 间 和 地 点 跟踪 所 使 用 的 图 像 ( 可 搜索 放 
在 Web 网 页 上 的 图 像 ) 。 对 于 征收 版 税 和 /或 非法 用 户 定位 监测 很 有 用 。 

5. 复制 保护 。 水 印 可 制定 使 用 和 复制 图 像 的 规则 (如 对 DVD 播放 器 ) 。 


本 节 简 要 介绍 提供 数字 图 像 水 印 的 过 程 ， 即 数字 图 像 水 印 处 理 是 把 数据 插入 到 一 幅 图 像 中 的 过 
程 ， 进 而 形成 对 图 像 的 保护 。 描 述 过 的 这 些 方法 与 前 一 节 已 有 的 压缩 技术 并 无 相同 之 处 ， 但 它们 的 确 
都 涉及 信息 编码 。 事 实 上 ， 水 印 处 理 和 压缩 在 某 些 方面 是 相对 的 。 压 缩 的 目的 是 减少 用 于 表示 图 像 的 
数据 量 ， 但 水 印 处 理 的 目的 是 在 图 像 上 添加 信息 和 数据 ( 即 水 印 ) 。 正 如 我 们 在 本 节 其 余 内 容 中 所 看 到 
的 那样 ， 水 印 本 身 可 以 是 完全 可 见 的 或 不 可 见 的 。 

可 见 水 印 是 一 幅 不 透明 的 或 半 透 明 的 子 图 像 ， 或 是 放 在 另 一 幅 图 像 ( 即 用 水 印 处 理 的 图 像 ) 之 上 的 
图 像 ， 因 此 ， 它 对 观察 者 是 显而易见 的 。 电 视 网 络 通常 把 可 见 水 印 (依照 其 标识 风格 ) 放 在 屏幕 的 右上 
角 或 右 下 角 。 如 下 面 的 例子 表明 的 那样 ， 可 见 水 印 处 理 通常 在 空间 域 执行 。 

例 8.29 简单 的 可 见 水 印 < cS Sak 
TEO 中 国人 的 有 四 分 
代表 水 印 的 图 像 ， 我 们 可 把 J 








i et 


i Cs 1) 

是 不 透明 的 ， 并 且 衬 底 图 像 完 
水 印 。 H#, 0<a <1; 在 图 8.50(b) 
,) 中 来 加 水 印 图 像 的 差 。 灰 度 128 表示 
: 在 图 8.500) he an EA 


CANAL. A a 接近 0, SRA 图 像 和 更 少 | 
中 ，& =0.3。 图 8.50(0) 是 图 8. 50 (b) causes 8.91 
0 差 值 。 HER. ering isc phen 
中 是 很 明显 的 。 ， ae 


与 前 面 例子 的 可 见 水 印 不 同 , 不 可 见 水 印 裸眼 是 看 不 见 的 。 它们 不 能 被 感知 ， 但 使 用 合适 的 解码 
算法 可 恢复 它 。 不 可 见 性 是 通过 作为 可 见 的 元 余 信 息 插 入 水 印 来 保证 的 ， 如 人 了 眼 视觉 系统 所 忽略 的 或 
不 能 感知 ( 见 8.1.3 节 ) 的 信息 。 图 8.51 (a) 提 供 了 一 个 简单 的 例子 。 因 为 8 比特 图 像 中 的 最 低 阶 比特 对 
我 们 感知 图 像 实质 上 没有 效果 , 来 自 图 8.50 (a) 的 水 印 被 插入 或 “隐藏 ”在 两 个 最 低 阶 比特 中 。 使 用 上 
面 介绍 的 符号 ,我 们 令 





f= 4 Php (8.3-2) 
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并 使 用 无 符号 整数 算术 来 执行 计算 。 用 4 除 f， 再 乘 4， 置 7 的 两 个 最 低 阶 比特 为 0, 用 64 除 w， 把 它 


的 两 个 最 高 阶 比特 移 到 两 个 最 低 阶 比特 的 位 置 ， 再 把 两 个 结果 相 加 ， 产生 LSB 水 印 图 像 。 注 意 , HRA 
的 水 印 在 图 8.51 (a) 中 不 可 见 。 把 这 一 图 像 的 最 高 有 效 6 比特 置 0, 并 把 其 余 的 值 放大 到 整个 灰 度 范围 ， 
就 可 提取 出 水 印 ， 如 图 8.51 (b) 所 示 。 





igital Image 
Processing 


abe tall 


图 8.50 一 个 简单 的 可 见 水 印 ，(a) 水印; (b) 加 过 水 印 的 图 像 ; 
(c) 加 过 水 印 的 图 像 和 原 图 像 (未 加 水 印 图 像 ) 间 的 差 


不 可 见 水 印 的 一 个 重要 特性 是 ， 它 能 抵抗 偶然 和 故意 删除 它们 的 企图 。 对 艇 人 了 易 碎 的 、 不 可 见 
水 印 的 图 像 的 任何 修改 ， 都 会 破坏 这 种 水 印 。 在 某 些 应 用 中 ， 如 图 像 鉴 定 ， 这 是 所 期 望 的 一 种 特性 。 
如 图 8.51 (c) Al (d) 所 示 , 图 8.51 (a) P LSB 失信 过 水 印 的 图 像 包含 易 碎 的 不 可 见 水 印 。 如 果 图 8.51 (a) 
中 的 图 像 用 有 损 JPEG 来 压缩 和 解压 缩 ， 就 会 破坏 水 印 。 图 8.51 (c) 是 图 8.51 (a) 经 压缩 和 解压 缩 后 的 
结果 ; 均 方 根 误差 (rms) 是 2.1 比特 。 如 果 我 们 试图 用 与 图 8.51 (b) 中 相同 的 方法 从 这 幅 图 像 中 提取 水 
El, 那么 结果 是 不 可 理解 的 [ 见 图 8.51(d) |. 虽然 有 损 压缩 和 解压 缩 保留 了 图 像 中 的 重要 视觉 信息 ， 
但 会 破坏 易 碎 的 水 印 。 
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图 8.51 一 个 简单 的 不 可 见 水 印 ，(a) 加 过 水 印 的 图 像 ;(b) 提取 的 水 印 ; (e) 
高 质量 JPEG 压缩 和 解压 缩 后 加 过 水 印 的 图 像 ，(d) 从 图 (c) 中 提取 的 水 印 


鲁 棒 的 不 可 见 水 印 设计 用 于 使 图 像 能 经 受 修改 ， 而 不 管 所 谓 的 攻击 是 有 意 的 还 是 无 意 的 。 常 见 
的 无 意 攻击 包括 有 损 压 缩 、 线 性 和 非 线性 滤波 、 修 剪 、 旋 转 、 重 取样 和 类 似 的 操作 。 故 意 攻击 包括 
从 打印 和 重 扫描 到 添加 附加 的 水 印 和 /或 噪声 等 。 当 然 , 使 图 像 本 身 处 在 不 可 用 状态 的 抗 攻 击 是 没有 
必要 的 。 

图 8.52 显示 了 一 个 典型 图 像 水 印 处 理 系统 的 基本 组 成 部 分 。 图 8.52 (a) 中 的 编码 器 把 水 印 vw, 插入 
到 图 像 /中 , 产生 加 过 水 印 的 图 像 六 ; 图 8.52 (b) 中 的 解码 器 提取 和 验证 加 过 水 印 的 输入 A, 或 没有 加 
过 水 印 的 输入 无 中 w 的 存在 性 。 如 果 w 可 见 ， 则 不 需要 解码 器 ;如 果 不 可 见 ， 解 码 器 可 能 需要 也 可 
能 不 需要 f, A w, 的 副本 [ 在 图 8.52 (b) 中 以 灰色 显示 ] 去 做 提取 或 验证 工作 。 如 果 使 用 了 /和 /或 ， 
则 水 印 处 理 系统 是 已 知 的 私 铀 系统 或 受 限 密 铀 系统 ; 如果 不 用 ， 则 称 为 公 钥 系统 或 不 受 限 密 钥 系 统 。 
因为 解码 器 必须 处 理 加 过 水 印 的 图 像 和 没有 加 过 水 印 的 图 像 ， 在 图 8.52 中 使 用 wo 来 表示 不 存在 水 印 。 
最 后 ， 我 们 注意 到 ， 为 确定 图 像 中 是 否 存在 w ， 解 码 器 必须 对 提取 的 水 印 w 与 w 做 相关 操作 ， 并 将 
相关 操作 的 结果 与 一 个 预定 义 的 阔 值 进行 比较 。 阔 值 用 于 设置 一 个 可 接受 “匹配 ”的 相似 度 。 
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图 8.52 一 个 典型 的 图 像 水 印 处 理 系 统 : (a) 编码 器 ; (b) 解码 器 


例 8.30 基于 DCT 的 不 可 见 的 鲁 棒 水 印 。 
水 印 嵌 入 和 提取 可 如 前 几 个 例子 那样 在 空间 域 执行 ， 或 变换 域 中 执行 。 图 8.53 (a) 和 (ce) 显示 了 图 8.9 (a) 
中 图 像 的 两 个 基于 DCT 的 水 印 方法 的 已 加 水 印 版 本 ， 方 案 如 下 (Cox et al[1997]) : 
BR 1 计算 将 被 加 入 水 印 图 像 的 二 维 DCT 伪 随 机 数 序列 的 性 质 近 似 随 机 数 的 
步骤 2 按 幅 值 定位 它 的 K 个 最 大 系数 ,esiyck 性 质 。 它 并 不 是 真正 随机 的 ,因为 它 
“步骤 3， 通 过 生成 一 个 K 元 素 伪 随机 数 序列 opo o Uik [PAT AOR, 
印 ， 这 些 伪 随机 数 取 自 均值 上 = 0、 方 益 c =1 的 一 个 高 斯 分 布 。 
步骤 4 使 用 下 式 ， 将 步骤 3 得 到 的 水 印 嵌 大 到 步 又 2 得 到 的 天 个 最 大 DCT 系数 中 : 
c=¢,(l+am), 1<i<K (8.3-3) 


式 中 , 指定 常数 & > 0 ( 它 控制 w 更 改 c 的 范围 ) 。 使 用 式 (8.3-3) 计 算 的 a 
代替 原来 的 c o i ae 
BRS “计算 来 自 步骤 4 的 结果 的 反 DFT。 


通过 采用 由 伪 随 机 数 形成 的 水 印 , 并 把 它 它们 散布 到 一 幅 图 像 感知 上 的 重要 频率 成 分 上 ， a 可 取得 较 小 ， 
以 降低 水 印 的 可 见 性 。 同 时 ， 水印 保持 较 高 的 安全 性 ， 因 为 (1) 水 印 由 无 明显 结构 的 伪 随 机 数组 成 ，(2) 水 
印 被 柑 入 到 影响 整个 二 维 空 间 图 像 的 多 个 频率 成 分 中 (因此 ， 它 们 的 位 置 并 不 明显 ) ，(3) 对 它们 的 攻击 也 
会 使 图 像 降 质 ( 也 就 是 说 ， 图 像 的 大 多 数 重要 频率 万 分 必须 被 改变 ， 以 影响 水 印 ) 。 

”由 于 在 图 8.53 (a) 和 (c) 中 图 像 的 DCT 系数 上 柑 入 了 来 自 伪 随 机 数 的 水 印 图像 ， 因 此 图 8.53 (b) 和 (d) 
中 图 像 的 灰 度 产生 了 变化 。 很 明显 ， 伪 随机 数 必须 有 一 个 效果 ， 即 在 加 过 水 印 的 图 像 上 它 很 小 ， 以 至 于 看 
不 见 。 为 了 显示 这 一 效果 ， 从 图 8.9(a) 所 示 没 有 加 过 水 印 的 图 像 中 减 去 图 8.53 (a) 和 (c) 中 的 图 像 ， 并 将 灰 
度 范 围 放大 到 区 间 [0, 255]。 图 8.53 (b) 和 (d) 是 结果 图 像 ; 它们 显示 了 伪 随机 数 的 二 维 空间 贡献 。 然 而 ， 因 
为 它们 已 被 放大 ， 我 们 不 能 简单 地 把 这 些 图 像 加 到 图 8.9 (a) 的 图 像 上 ， 并 得 到 图 8.53 (a) M Ce) 中 的 水 印 图 
像 。 正 如 在 图 8.53 (a) 和 (c) 中 看 到 的 那样 ， 它 们 的 实际 灰 度 干扰 小 到 可 以 忽略 不 计 。 

为 了 确定 一 幅 特 定 的 图 像 是 否 是 一 幅 事 先 加 过 水 印 图 像 的 副本 ; 该 图 像 具 有 水 印 @,@,,…,@: 和 DCT 
系数 o,c,…,cx a 我们 采用 下 列 步 又 : 

步骤 1 “计算 该 问题 中 图 像 的 二 维 DCT. 

步骤 2 提取 天 个 DCT 系数 (对 应 于 水 印 处 理 过 程 中 步 又 2 的 ci,e;,…,cx 的 位 置 ) ,并 将 这 些 系数 表 
IWA Â, Ĝe Cg 。 如 果 问 题 图 像 是 事先 加 过 水 印 的 图 像 (未 被 修改 ) ， 则 对 于 ISi< K AE =c i 
果 它 是 加 过 水 印 图 像 的 一 个 修改 过 的 副本 ( 即 它 受到 过 某 种 攻击 )， 则 对 于 IS iS KA â xc! (6 是 cl 


第 8 章 AK & 397 


的 近似 ) 。 和 否则 ， 问 题 图 像 将 是 一 幅 无 水 印 图 像 ， 或 是 一 幅 具 有 完全 不 同 水 印 的 图 像 一 一 6; 将 不 会 类 似 
于 原始 的 cs 





i | 上 3 | 4 J 1 E abcd 
图 8.53 ” (a) 和 (c) 图 8.9(a) 的 两 个 加 过 水 印 的 版 本 ; (b) 和 (d) 加 过 水 印 的 图 像 和 没有 加 过 水 印 的 图 像 
间 的 差 ( 灰 度 被 放大 了 ) 。 这 两 幅 图 像 显 示 了 伪 随 机 水 印 对 原 图 像 的 灰 度 贡献 (尽管 缩放 显著 ) 


步骤 3 使 用 下 式 计算 水 印 心 ， Dy ,Ok 
is EASE ES et (8.3-4) 


回顾 可 知 ， 水 印 是 一 个 伪 随 机 数 序列 。 
步骤 4 用 一 个 参数 ， 如 相关 系数 ， EE Ô, Ô, Ôg RAZR 2) ; Pre 

21 节 中 将 详细 探讨 相关 系数 
与 @,@,,…,@x (来 自 符 大 水 印 过 程 的 步骤 3) 的 相似 度 ， me 讨 相关 系数 。| 





pe 
> (O = AN0, CN ©) 
y= = > ETES (8.3-5) 
= 的 (一 可 
i=! i=l 
式 中 ,5 和 全 是 两 个 元 素 水 印 的 均值 。 
步骤 5， 将 度量 的 相似 度 志 与 一 个 预定 义 的 阔 值 进行 比较 ， 并 进行 二 值 检测 判决 : 
| cae ied : 
| p=; fon (8.3-6) 
换 名 话说 , D= 1 表明 水 印 @,w;,,…,wx 存在 (关于 特定 的 阔 值 力 ; D=0 则 表明 水 印 不 存在 。 
使 用 这 一 过 程 ， 图 8.53 (a) 中 加 过 水 印 的 原始 图 像 ， 针 对 其 本 身 度量 ， 得 到 一 个 相关 系数 0.999 9， 即 
y=0.999 9 。 它 是 一 个 无 错误 的 匹配 。 采用 相似 的 方法 ， 当 针对 图 8.53 (a) 中 的 图 像 度 量 时 ， 图 8.53 (b) 中 的 
图 像 会 得 到 y=0.041 7 ， 对 于 图 8.53 (a) 中 加 过 水 印 的 图 像 ， 它 不 可 能 被 弄 错 ， 因 为 相关 系数 很 小 。 


在 结束 本 节 时 ， 我们 注意 到 ， 前 例 中 的 基于 DCT 的 水 印 处 理 方 法 可 完全 抵抗 水 印 攻击 ， 部 分 原 
因 是 ,这 是 一 种 私 钥 方法 或 受 限 密 钥 方 法 , 受 限 密 钥 方法 总 是 要 比 非 受 限 密 钥 方法 灵活 。 使 用 图 8.53 (a) 
中 的 加 过 水 印 的 图 像 ， 图 8.54 说 明了 该 方法 抵抗 各 种 常见 攻击 的 能 力 。 如 图 中 所 看 到 的 那样 ， 水 印 检 
测 在 被 执行 的 攻击 范围 之 外 要 好 得 多 一 一 得 到 的 相关 系数 (显示 在 图 中 每 幅 图 像 的 下 方 ) 在 0.3113 到 
0.9945 间 变 化 。 在 受到 高 质量 但 有 损 (导致 7 个 灰 度 级 的 均 方 根 误差 ) 的 JPEG 压缩 和 解压 缩 时 ， 
y =0.9945 。 甚 至 当 压 缩 和 重建 产生 10 个 灰 度 级 的 均 方 根 误差 时 ，y = 0.7395 一 一 该 图 像 的 可 用 性 明 
显 降低 。 使 用 空间 滤波 的 有 效 平滑 和 加 入 高 斯 噪声 ， 都 未 使 相关 系数 降 到 0.8230 以 下 。 然而， 直方 图 





均衡 会 把 y 减 小 到 0.5210; 而 旋转 的 影响 最 大 ， 它 把 y 减 小 到 0.3313。 除 了 图 8.53 (a) 中 的 有 损 JPEG Pal 


压缩 和 重建 外 ， 所 有 攻击 都 大 大 降低 了 原始 加 过 水 印 的 图 像 的 可 用 性 。 
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Y= 0.31] 

图 8.54 对 图 8.53 (a) 中 加 过 水 印 的 图 像 的 攻击 : (a) 具有 7 个 灰 度 级 均 方 根 误差 的 有 损 JPEG 压缩 和 
解压 缩 图 像 ;(b) 具有 10 个 灰 度 级 的 均 方 根 误差 的 有 损 JPEG 压缩 和 解压 缩 图 像 (注意 块 效 
应 ) ; (c) 用 空间 滤波 方法 平滑 处 理 的 结果 ; (d) 加 入 高 斯 噪声 的 图 像 ; (e) 直方 图 均衡 后 的 
图 像 ; (人 旋转 后 的 图 像 。 每 一 幅 图 像 都 是 图 8.53 (a) 中 加 过 水 印 图 像 的 一 个 修改 版 本 。 修 
改 之 后 ， 它 们 不 同 程度 地 保留 了 各 自 的 水 印 ， 如 每 幅 图 像 下 方 的 相关 系数 指出 的 那样 





y = 0.5210 





y = 0.8230 


小 结 


本 章 的 主要 目的 是 介绍 数字 图 像 压 缩 的 理论 基础 ， 描 述 最 常用 的 压缩 方法 ， 并 介绍 数字 图 像 
水 印 处 理 的 相关 领域 。 尽 管 论述 是 介绍 性 的 ， 但 参考 资料 提供 了 这 一 主题 的 广泛 性 论述 。 如 表 8.3 
和 表 8.4 中 所 列国 际 标准 表明 的 那样 ,压缩 方法 在 文献 图 像 存储 与 传送 、 互 联网 和 商业 视频 传播 (如 
DVD) 方 面 有 着 重要 作用 。 压 缩 也 是 少数 几 个 在 商业 上 广泛 要 求 对 普遍 接受 的 标准 进行 授权 使 用 的 
图 像 处 理 领域 之 一 。 由 于 越 来 越 多 的 图 像 以 压缩 的 数字 格式 进行 传播 ， 因 此 图 像 水 印 处 理 变 得 越 
来 越 重要 。 


参考 文献 


本 章 8.1 节 的 介绍 性 材料 是 图 像 压 缩 的 基础 , 第 1 章 末尾 给 出 的 多 数 图 像 处 理 书 籍 中 , 都 能 找到 不 
同形 式 的 内 容 。 关于 人 类 视觉 系统 的 其 他 信息 , 见 Netravali and Limb[1980]、Huang[1966]、Schreiber and 
Knapp[1958] 及 第 2 章 结 尾 处 给 出 的 文献 。 关 于 信息 论 的 更 多 内 容 ， 见 本 书 的 网 站 或 Abramson[1963]、 
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Behrend[1960]。 

贯穿 全 章 的 许多 例子 中 使 用 了 各 种 压缩 标准 。 大 多 数 例子 都 是 用 Adobe Photoshop (有 能 免费 使 用 的 
压缩 插件 ) 和 /或 MATLAB 实现 的 ， 详 见 Gonzalez et al.[2004]。 一 般 来 说 ， 压 缩 标准 是 元 长 且 复 杂 的 ; 
我 们 不 可 能 全 部 覆盖 它们 。 关 于 某 个 特殊 标准 的 详细 信息 ,可 参阅 相关 标准 组 织 ( 国际 标准 化 组 织 、 国 
际 电子 技术 委员 会 和 /或 国际 电信 联盟 ) 发 布 的 文件 。 标 准 方面 的 其 他 参考 文献 有 Hunter and 
Robinson[1980], Ang et al.[1991]、Fox[1991]、Pennebaker and Mitchell[1992]、Bhatt et al.[1997], Sikora 
[1997], Bhaskaran and Konstantinos[1997], Ngan et al.[1999], Weinberger et al.[2000]、Symes[2001]、 
Mitchell et al.[1997] 和 Manjunath et al.[2001]. 
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8.2 节 中 描述 的 有 损 和 无 误差 编码 技术 与 8.3 节 中 的 水 印 处 理 技术 ， 大 部 分 源 于 本 书 引 用 的 原始 论文 。 涵 盖 
的 算法 是 这 一 领域 中 具有 代表 性 的 研究 成 果 , 但 不 是 全 部 成 果 - 关 于 LZW 编码 的 素材 , 源 自 Ziv and Lempel[1977, 
1978]。 算 术 编 码 的 内 容 源 自 Witten, Neal and Cleary[1987]。 算 术 编 码 的 一 种 更 为 重要 的 实现 见 Pennebaker et 
al.[1988] 。 对 于 无 损 预 测 编码 的 较 好 论述 ， 见 Rabbani and Jones[1991] 。 式 (8.2-56) 的 自 适应 预测 器 来 自 
Graham[1958]. 关 于 运动 补偿 的 更 多 内 容 , 见 S. Solari[1997] 它 还 包含 普通 视频 压缩 和 压缩 标准 的 介绍 ) 和 Mitchell 
et al.[1997]。8.3 节 中 基于 DCT 的 水 印 处 理 技术 源 于 Cox et al.[1997]。 关 于 水 印 处 理 的 更 多 内 容 ， 见 Cox et 
al.[2001], Parhi and Nishitani[1999] 和 S. Mohanty[1999]。 

图 像 压缩 领域 的 综述 性 文章 也 有 很 多 ,包括 Netravali and Limb[1980]、A. K. Jain[1981], ZEEE 
Transactions on Communications[1981] 图 像 通 信和 系统 专刊 、Proceedings of IEEE[T1980] 图 形 编码 专刊 、 
Proceedings of the IEEE[1985] 视 觉 通 信 系统 专刊 、IEEE Transactions on Image Processing [1994] 图 像 序列 压缩 
专刊 ， 以 及 IEEE Transactions on Image Processing[1996] 和 失 量 量化 专刊 。 此 外 ，IEEE Transactions on Image 
Processing, IEEE Transactions on Circuits and Systems for Viedo Technology 和 IEEE Transactions on Multimedia 
等 刊物 中 也 包含 有 关于 视频 和 静止 图 像 压 缩 、 运 动 补偿 和 水 印 处 理 方面 的 文章 。 例 如 ，Robinson[2006]、 
Chandler and Hemami[2005]、 Yan and Cosman [2003]、Boulgouris et al.[2001]、 Martin and Bell [2001] 、Chen and 
Wilson[2000], Hartenstein et al.[2000], Yang and Ramchandran [2000], Meyer et al.[2000]、 S. Mitra et al. [1998], 
Mukherjee and Mitra[2003], Xu et al.[2005], Rane and Sapiro[2001], Hu et al.[2006]、 Pi et al.[2006], Dugelay et 
al.[2006] 和 Kamstra and Heijmans[2005]， 都 可 作为 深入 阅读 和 参考 的 起 点 。 


习题 


8.1 (a) 变 长 编码 过 程 能 否 用 于 压缩 具有 2" 个 灰 度 级 直方 图 均衡 过 的 图 像 ? 请 解释 其 原因 。 
(b) 这 样 一 幅 图 像 是 否 包含 可 以 用 于 数据 压缩 的 空间 和 时 间 和 元 余 ? 

8.2 ”行程 编码 的 一 种 变形 是 : (1) 只 对 0 行程 或 1 行程 (而 非 两 者 ) 编码 ，(2) 在 每 行 的 开始 处 分 配 一 个 特 
殊 的 码 ， 以 减 小 传输 误差 的 影响 。 一 种 可 能 的 编码 对 是 (x ,n) ， 其 中 x, 和 分 别 表 示 第 个 行程 
的 起 始 坐 标 和 行程 。 编 码 (0, 0) 用 于 表示 每 个 新 行 。 
(a) 当 对 一 幅 大 小 为 2"x2" 的 二 值 图 像 进行 行程 编码 时 ,推导 为 确保 数据 压缩 而 要 求 的 每 条 扫描 线 最 

大 平均 行程 的 一 般 表达 式 。 

(b) 计算 n=8 时 的 最 大 允许 值 。 

8.3 ”考虑 灰 度 数据 为 {255, 118, 127, 182, 18, 178, 82, 55} 的 一 条 8 像素 的 线 。 如 果 使 用 4 比特 精度 来 均匀 
量化 它 ， 计 算 量化 后 的 数据 的 均 方 根 误差 和 均 方 根 信 了 品 比 。 

*8.4 ”虽然 量化 会 导致 信息 损失 , 但 对 人 眼 来 说 有 时 它 是 不 可 见 的 。 例如， 当 8 比特 像素 被 均匀 量化 为 更 

少 的 比特 /像素 时 ， 通常 会 出 伪 轮 廓 。 使 用 改进 的 灰 度 缩放 IGS) 量化 方法 ， 可 以 减少 或 消除 它 。 一 
个 和 值 ( 开 始 时 置 0) 是 由 当前 的 8 比特 灰 度 值 和 前 一 个 生成 的 和 的 4 个 最 低 阶 比特 形成 的 。 如 果 灰 
度 值 的 4 个 最 高 阶 比特 是 1111，,，， 因 此 加 0000: 蔡 换 它 。 产 生 的 和 的 4 个 最 高 阶 比特 被 用 做 编码 后 
的 像素 值 。 
(a) 对 灰 度 数据 {108, 139, 135, 244, 172, 178, 56, 97} 构 造 IGS 编码 。 
(b) 对 解码 后 的 IGS 数据 ， 计 算 均 方 根 误差 和 均 方 根 信 品 比 。 

8.5 ”对 大 小 为 1024x1024、 炉 为 4.2 比特 /像素 [ 使 用 式 (8.1-7) 从 其 直方 图 计算 得 到 ] 的 8 比特 图 像 进 行 
霍 夫 曼 编码 。 
(a) 所 期 望 的 最 大 压缩 率 是 多 少 ? 
(b) 它 能 得 到 吗 ? 
(c) 如 果 要 求 较 高 级 别 的 无 损 压 缩 ， 还 应 该 做 什么 ? 
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*8.6 


*8.7 


8.8 


8.9 
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以 e 为 底 的 信息 单位 通常 称 为 奈 特 (nat) ， 以 10 为 底 的 信息 单位 则 称 为 哈 特 利 (Hartley) 。 计 算 将 这 
些 单位 与 以 2 为 底 的 信息 单位 (比特 ) 联系 起 来 的 转换 因子 。 
证 明 ， 对 于 有 4 个 符号 的 零 记 忆 信 源 ， 焙 的 最 大 值 为 log gq。 当 且 仅 当 所 有 信 源 符号 等 概率 出 现时 ， 
焙 才 能 达到 最 大 值 。 [ 提示 : 考虑 量 log g -= H(z) 并 注意 不 等 式 Inx Sls | 
(a) 对 于 一 个 4 符号 信 源 ， 有 多 少 唯 一 的 霍 夫 曼 编 码 ? 
(b) 构建 它们 。 
考虑 如 下 大 小 为 4x8 的 8 比特 图 像 : 
21 21 95 95 169 169 243 243 
21 21 95 95 169 169 243 243 
21 21 95 95 169 169 243 243 
21 21 95 95 169 169 243 243 
21 21 95 95 169 169 243 243 
(a) 1} RIKEURANG. 
(b) 用 霍 夫 曼 编码 压缩 该 图 像 。 
(c) 计算 霍 夫 曼 编码 能 达到 的 压缩 率 和 效率 。 


k (d) 考虑 对 一 对 像素 而 非 单个 像素 进行 霍 夫 曼 编码 。 也 就 是 说 ， 考 虑 由 产生 原 图 像 的 零 记 忆 信 源 的 


8.10 
8.11 
8.12 
8.13 
8.14 
* 8.15 
8.16 
8.17 
* 8.18 


第 二 次 扩展 产生 的 图 像 。 SERA, ARMA? 

(e) 考虑 对 相 邻 像素 间 的 差 值 进行 编码 。 新 的 差 值 图 像 的 焙 是 什么 ”关于 压缩 图 像 ， 它 告诉 我 们 做 
什么 ? 

解释 (al) (d) F Ce) PRR. 

用 图 8.8 中 的 霍 夫 曼 码 ， 对 编码 串 01010010000011101011 进行 解码 。 

WFO <n < 20, 计算 Golomb 码 G;(n) 

针对 Golomb 码 G,,(n)， 写 出 解码 的 通用 过 程 。 

为 什么 用 式 (8.2-2) 的 几何 概率 密度 函数 不 能 计算 n S 0 的 非 负 整 数 的 霍 夫 曼 码 ? 

对 于 0 Sn S15, HAFEZ Golomb 1 Gap (n) o 

针对 指数 Golomb 码 G5 (n) ， 写 出 解码 的 通用 过 程 。 

在 式 (8.2-3) 中 ,对 于 0<p<1， 画 出 作为 p 的 函数 的 最 佳 Golomb 编码 参数 m 的 曲线 。 

给 定 一 个 4 符号 信 源 {a, b, c, d} ， 信 源 概率 为 {0.1, 0.4, 0.3, 0.2}， 对 序列 abcda 进行 算术 编码 。 

算术 解码 过 程 是 与 编码 过 程 相反 的 过 程 。 用 给 定 的 编码 模型 ， 对 消息 0.32256 进行 解码 。 





使 用 8.2.4 节 中 的 LZW 编码 算法 ， 对 7 比特 ASCI 码 字 符 串 “AAAAAAAAAAA” 进 行 编码 。 

为 例 8.7 的 LZW 编码 输出 的 解码 操作 设计 一 种 算法 。 由 于 编码 期 间 使 用 的 字典 此 时 不 saad 所 

以 在 对 输出 进行 解码 时 必须 重新 生成 码 书 。 

对 BMP 编码 序列 {127, 0, 5, 25, 29, 40, 103, 52, 75, 82} 进 行 解码 。 

(a) 构造 完整 的 4 比特 格雷 码 。 

(b) 创建 一 个 通用 的 过 程 ， 将 格雷 码 的 数字 转换 成 与 其 等 价 的 三 进 制 码 ， 并 用 它 对 0111010100111 
进行 解码 。 
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使 用 CCITT Group 4 压缩 算法 对 如 下 两 行 的 第 二 行进 行 编码 : 
01100111001111111100001 
11111000111000111111000 

假设 初始 参考 元 素 ay 位 于 第 二 行 的 第 一 个 元 素 上 。 

(a) 列 出 JPEG DC 系数 第 3 类 差 的 所 有 成 员 。 

(b) 使 用 表 A.4 计算 它们 的 默认 霍 夫 曼 编码 。 

使 用 MAD 最 佳 准则 、 单 像素 精度 和 最 大 允许 的 16 个 像素 的 位 移 ， 找 到 一 个 8x8 宏 块 的 最 佳 运动 
向 量 需 要 多 少 计 算 ? 对 于 1/4 像素 精度 ， 它 变 成 多 少 次 计算 ? 

对 于 运动 补偿 ,使 用 B 帧 的 优点 是 什么 ? 

画 出 针对 图 8.39 中 编码 器 的 伴随 运动 补偿 视频 解码 器 的 方 框图 。 

用 一 个 二 阶 预测 器 对 自 相关 函数 是 式 (8.2-49) 在 p, = 0 时 的 形式 的 一 幅 图 像 进行 DPCM 编码 。 

(a) 构造 自 相 关 和 矩阵 六 和 向 量 ro 

(b) 找 出 最 佳 预测 系数 。 

(c) 计算 使 用 最 佳 系数 得 到 的 预测 误差 的 方差 。 

推导 出 工 =8 时 的 劳 埃 德 : 马克 斯 判决 -重建 级 别 和 均匀 概率 密度 函数 。 

1 
p(s)=4 24° 
0, 其 他 

来 自 一 所 著名 研究 型 医院 的 一 位 放射 学 家 最 近 参 加 了 一 次 医学 会 议 , 会 上 展示 了 一 种 可 以 通过 标准 
T1 (1.544 Mbps) 电话 线路 传输 4096 x 4096 大 小 的 12 比特 数字 化 X 光 图 像 的 系统 。 该 系统 使 用 一 种 
渐进 技术 来 传输 压缩 形式 的 图 像 ， 这 种 技术 可 在 观察 站 首先 重建 出 X 射线 图 像 的 较 好 近似 图 像 ， 


-然后 逐步 细 化 产生 一 幅 无 误差 的 显示 。 产生 第 一 幅 近似 图 像 的 数据 传输 要 5~6 秒 的 时 间 。 在 接 下 来 


的 1 分 钟 时 间 内 ， 每 隔 5~6 秒 ( 平 均 ) 会 进行 一 次 细 化 ， 在 重建 的 X 射线 图 像 中 ， 第 一 次 和 最 后 一 
次 细 化 有 最 大 和 最 小 的 影响 。 这 位 物理 学 家 对 这 套 系统 的 印象 很 好 ， 因 为 她 可 以 使 用 第 一 幅 X 射 
线 图 像 的 近似 开始 进行 诊断 ， 而 在 生成 无 误差 X 射线 重建 图 像 时 就 可 以 完成 诊断 。 在 回 办 公 室 的 
途中 ,她 拟定 了 一 份 报 送 给 医院 领导 的 采购 意向 。 和 遗憾 的 是 ， 医 院 正 值 预算 紧张 时 期 ,因为 最 近 雇 
用 了 一 位 年 轻 有 为 的 电气 工程 专业 毕业 生 。 为 了 满足 放射 学 家 的 要 求 ， 院 方向 年 轻 的 工程 师 布 置 了 
设计 这 样 一 个 系统 的 任务 ( 院 方 认为 设计 和 构造 一 个 类 似 的 自用 系统 成 本 会 更 低 。 医 院 现在 拥有 这 
种 系统 的 某 些 部 件 ， 但 传输 原始 X 射线 数据 的 时 间 要 超过 2 分 钟 ) 。 院 方 要 求 工程 师 在 下 午 的 工作 
会 议 上 拿 出 一 个 初始 框图 。 由 于 时 间 紧 且 手 头 只 有 一 本 《数字 图 像 处 理 》 教 材 (当然 需要 这 本 书 ) ， 
工程 师 只 能 在 概念 上 设计 一 个 系统 ， 以 满足 传输 和 相关 的 压缩 要 求 。 请 构建 该 系统 的 概念 框图 ， 并 
详细 说 明 你 将 建议 的 压缩 技术 。 

证 明 由 式 (8.2-62) 定义 的 基于 提升 的 小 波 变换 ， 与 使 用 表 8.15 中 系数 实现 的 传统 FWT 滤波 器 组 是 
等 价 的 。 依 据 a, B, y, 0 和 天 定义 滤波 器 系数 。 

计算 一 幅 IPEG-2000 编码 图 像 的 子 带 的 量化 步 长 。 该 图 像 采用 导出 式 量化 ， 对 2LL 子 带 的 尾数 和 
指数 分 配 8 比特 数据 。 

你 如 何在 频率 域 将 水 印加 到 一 幅 图 像 上 ? 

以 离散 傅 里 叶 变 换 为 基础 ， 设 计 一 个 不 可 见 水 印 处 理 系统 。 

以 离散 小 波 变换 为 基础 ， 设 计 一 个 不 可 见 水 印 处 理 系统 。 
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eature, face and limb, | grew so like my brother. 
got taking me for him and each for one another. 


Henry Sambrooke Leigh, Carols of Cockayne, The Twins 


形态 学 (morphology) 一 词 通常 表示 生物 学 的 一 个 分 支 ， 该 分 支 主要 研究 动 植物 的 形态 和 结构 。 这 
E, 我 们 使 用 同一 词语 表示 数学 形态 学 的 内 容 ， 将 数学 形态 学 作为 工具 从 图 像 中 提取 表达 和 描绘 区 域 
形状 的 有 用 图 像 分 量 ， 如 边界 、 上 骨架 和 同学 等 。 我 们 对 预 处 理 或 后 处 理 的 形态 学 技术 也 感 兴 趣 ， 比 如 
形态 学 过 滤 、 细 化 和 修剪 等 。 

在 下 面 几 节 中 ， 我们 将 建立 并 说 明 数 学 形态 学 中 的 几 个 重要 概念 。 这 里 介绍 的 许多 概念 可 在 n 维 
欧 氏 空间 BE” 中 用 公式 表达 ,然而 ,我 们 的 兴趣 一 开始 是 二 值 图 像 ,这 种 图 像 的 各 个 分 量 是 忆 的 元 素 ( 见 
2.4.2 市 ) 。 在 9.6 节 ， 我 们 的 讨论 将 扩展 到 灰 度 图 像 。 

本 章 的 内 容 开 始 从 输入 和 输出 都 是 图 像 的 图 像 处 理 ， 转 变 为 输入 是 图 像 而 输出 是 从 这 些 图 像 中 提 
取 的 属性 的 处 理 , 详 见 1.1 节 的 定义 。 形 态 学 及 与 其 相关 数学 概念 ， 用 于 从 图 像 中 提取 “内 涵 ”。 本 书 
的 余下 章节 中 将 探讨 和 应 用 其 他 方法 。 


9.1 预备 知识 


数学 形态 学 的 语言 是 集合 论 。 同 样 ， 形 态 学 为 大 量 的 图 像 处 理 问 -一 一 -- 
题 提供 一 种 一 致 且 有 力 的 方法 。 数 学 形态 学 中 的 集合 表示 图 像 中 的 对 “| ,全 阅读 之 前 , 请 读者 回顾 一下 
象 。 例 如 ， 在 二 值 图 像 中 ， 所 有 白色 像素 的 集合 是 该 图 像 的 一 个 完整 
的 形态 学 描述 。 在 二 值 图 像 中 ， 问 题 集 合 是 二 维 整数 空间 ZTR ( 见 2.4.2 节 ) ， 在 该 空间 中 ， 集 合 
的 每 个 元 素 都 是 一 个 多 元 组 (二 维 向 量 ), 这 些 多 元 组 的 坐标 是 图 像 中 一 个 白色 (或 黑色 , 取决 于 事先 的 
约定 ) 像 素 的 坐标 (x, 力 。 前 一 章 讨论 过 的 灰 度数 字 图 像 可 以 表示 为 其 分 量 在 空间 如 中 的 集合 。 在 这 种 
情况 下 ， 集 合 中 每 个 元 素 的 两 个 分 量 提供 个 像素 的 坐标 ,第 三 个 分 量 则 对 应 于 其 离散 灰 度 值 。 更 高 
维度 空间 中 的 集合 可 以 包含 其 他 的 图 像 属性 ， 如 颜色 和 随时 间 变 化 的 分 量 。 
除 2.6.4 节 中 的 基本 集合 定义 外 , 集合 的 反射 和 平移 概念 在 形态 学 


2.4.2 节 和 2.6.4 节 的 内 容 。 





集合 反射 操作 类 似 于 空间 卷 积 中 执 


a 中 用 得 也 很 广泛 。 一 个 集合 B 的 反射 表示 为 上 ， 定 义 如 下 : 行 的 翻转 (旋转 ) 操 作 ( 见 342 节 ) 。 
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B={w|w=-b, be B} (9.1-1) 


如 果 B 是 描述 图 像 中 物体 的 像素 的 集合 (二 维 点 ) WU BEE B 中 (x, yy) 坐标 被 (x, 一 y) 蔡 代 的 点 的 集合 。 
图 9.1(a) 和 (b) 显示 了 一 个 简单 的 集合 及 其 反射 ”。 


abc 








B), 
图 9.1 (a) 一 个 集合 (b) 该 集合 的 反射 ;(c) 距离 为 z 的 平移 
集合 B 按 照 点 z= (z,,2z,) PAA (B), 的 平移 定义 如 下 : 
(B), ={clc=b+z, beB} (9.1-2) 


E B 是 描述 图 像 中 物体 的 像素 集合 ， 则 (B), Æ B Ha, yy) 坐标 被 (x+z1,y+z,) 替 代 的 点 的 集合 。 
图 9.1 bt 9.1 (a) 的 集合 召 说 明了 这 一 概念 。 
学 中 集合 的 反射 和 平移 广泛 用 来 表达 基于 结构 元 (SE) 的 操作 : 研究 一 幅 图 像 中 感 兴趣 特性 所 

ei re 图 9.2 的 第 一 行 显示 了 结构 元 的 几 个 例子 , 其 中 每 个 涂 阴 影 的 方块 表示 SE 的 一 
个 成 员 。 给 定 结构 元 中 的 一 个 位 置 是否 是 该 SE 集合 的 成 员 没 有 关系 时 ， 该 位 置 用 “x” 来 标记 ， 表 示 
一 个 “不 关心 ”条 件 ， 如 稍 后 在 9.5.4 节 中 定义 的 那样 。 除 了 元 素 是 SE 的 成 员 的 定 i 
义 之 外 ， 还 必须 指定 结构 元 的 原点 。 图 9.2 中 各 种 SE 的 原点 
由 一 个 黑 点 指出 (尽管 将 SE 的 中 心 放 在 其 重心 处 很 普遍 , 但 通 
常 原点 的 选择 取决 于 具体 问题 ) 。 当 SE 对 称 且 未 显示 原点 时 ， 
则 假定 原点 位 于 对 称 中 心 处 。 

对 图 像 操作 时 , 我 们 要 求 结构 元 是 矩形 阵列 。 这 是 通过 添 
加 最 小 可 能 数量 的 背景 元 素 ( 图 9.2 中 所 示 的 非 阴影 部 分 ) 形 成 
一 个 矩形 阵列 来 实现 的 。 图 9.2 第 二 行 中 的 第 一 个 和 最 后 一 个 一 
SE 说 明了 该 过 程 。 该 行 中 的 其 他 SE 已 是 矩形 形式 。 UE 

为 介绍 在 形态 学 中 如 何 使 用 结构 元 ， 我 们 考虑 图 9.3。 
图 9.3 (a) 和 (b) 显示 了 一 个 简单 的 集合 和 一 个 结构 元 。 如 前 一 段 
提 到 的 那样 , 计算 机 实现 要 求 用 添加 背景 元 素 的 方法 把 4 也 转 
换 为 一 个 矩形 阵列 。 当 结构 元 的 原点 位 于 原始 集合 的 边界 上 
时 , 背景 边界 要 大 到 足以 容纳 整个 结构 元 (这 类 似 于 3.4.2 19 





图 9.2 第 一行 : 结构 元 的 例子 ; a 
行 : 转换 为 矩形 阵列 的 结构 
元 。 点 表示 结构 元 的 中 心 


D 对 图 像 操作 时 ， 如 图 9.1 中 的 集合 ， 我 们 使 用 阴影 来 表示 正 考虑 集合 的 成 员 的 点 (像素 ) 。 在 处 理 二 值 图 像 时 ， 感 兴趣 的 集合 是 对 |650 
应 于 物体 的 像素 。 我们 使 用 白色 像素 来 显示 这 些 集 合 ， 而 其 他 像素 则 显示 为 黑色 。 术 语 前 景 和 背景 通常 分 别 用 于 表示 图 像 中 为 ”| 


物体 和 非 物 体 定义 的 像素 集合 。 








404 数字 图 像 处 理 (F = hhh) 


讨论 的 空间 相关 和 卷 积 的 填充 操作 ) 。 在 这 种 情况 下 ， 结 构 元 的 大 小 为 


metas BRD ERR 在 后 面 的 说 明 中 ,我 们 会 添加 足够 的 
3x3， 原 点 位 于 中 心 ， 所 以 包围 整个 集合 的 一 个 元 素 的 边界 是 足够 的 ， | SEMIS Rane 


如 图 9.3 (c) 所 示 。 就 像 在 图 9.2 中 那样 ， 必 须 使 用 最 小 可 能 数量 的 背景 “| gg 下 ,为 简化 图 形 , 我 们 假定 已 进 
元 素 填充 结构 元 ， 使 它 成 为 一 个 矩形 阵列 [ 见 图 9.3 (d) J. 行 了 填充 操作 。 
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图 9.3 (a) 一 个 集合 (每 个 阴影 方块 都 是 集合 的 一 个 元 素 ) ; (b) 结构 元 ; 〈c) 使 用 背景 元 素 填充 集合 形成 的 一 个 
和 矩形 阵列 ， 并 且 提供 了 一 个 背景 边界 ; (d) 和 矩形 阵列 形式 的 结构 元 ;，(e) 由 结构 元 处 理 过 的 集合 


假定 我 们 定义 一 个 用 结构 元 B 在 集合 A 上 的 操作 如 下 : 通过 让 8 在 4 上 运行 ， 以 便 B8 的 原点 访 
E 4 的 每 个 元 素 ， 来 创建 一 个 新 集合 。 在 B 的 每 个 原点 位 置 ， 如 果 8B 完全 被 4 包含 ， 则 将 该 位 
置 标 记 为 新 集合 的 一 个 成 员 (阴影 所 示 ) ; 否则 ， 将 该 位 置 标记 为 非 新 集合 的 成 员 GERIR) 。 
图 9.3 (e) 显示 了 这 一 操作 的 结果 。 我们 看 到 ， 当 B 的 原点 位 于 4 的 边界 元 素 上 时 ，B 的 一 部 分 将 不 再 
包含 在 4 中, 从 而 排除 了 8B 处 在 中 心 位 置 的 点 作为 新 集合 的 成 员 的 可 能 。 最 终结 果 是 集合 的 边界 被 府 
蚀 ， 如 图 9.3 (e) 所 示 。 当 我 们 使 用 “结构 元 包含 在 集合 中 ”这 样 的 术语 时 ,我 们 明确 地 指出 4 和 8 的 
元 素 完 全 重合 。 换 句 话说 ,虽然 我 们 用 包含 阴影 和 非 阴 影 的 元 素 阵 列 来 说 明 4 AB, 但 在 确定 B 是 否 
包含 于 4 中 时 , 我 们 只 考虑 两 个 集合 中 的 阴影 元 素 。 这 些 概念 是 下 一 节 内 容 的 基础 ， 因 此 在 继续 学 习 
之 前 全 面 理解 图 9.3 中 的 概念 很 重要 。 


9.2 ”腐蚀 和 膨胀 


我 们 通过 研究 腐蚀 和 膨胀 这 两 个 操作 来 开始 形态 学 的 讨论 。 这 些 操作 是 形态 学 处 理 的 基础 。 事 实 
上 ， 本 章 中 讨论 的 许多 形态 学 算法 都 是 以 这 两 种 原始 操作 为 基础 的 。 
9.2.1 腐蚀 
EKZ 中 的 集合 4 和 B， 表 示 为 488 的 B 对 4 的 腐 刨 义 为 
A©B={z|(B), cA} (9.2-1) 
表面 上 , 该 式 指出 B 对 4 的 腐蚀 是 一 个 用 z 平 移 的 8 包含 在 4 中 的 所 有 的 点 z 的 集合 。 在 下 面 的 讨 
WP, BERE B 是 一 个 结构 元 。 式 (9.2-1) 是 上 节 末 尾 讨论 的 图 9.3 (e) 中 的 例子 的 数学 公式 。 因 为 


B 必须 包含 在 A 中 这 一 陈述 等 价 于 B 不 与 背景 共享 任何 公共 元 素 ， 故 可 以 将 腐蚀 表达 为 如 下 的 等 价 
形式 : 


46B = {z I(B), NA° =} (9.2-2) 
T| 式 中 ， 如 2.64 节 所 定义 的 那样 ，4" EARNE, DRAR, 
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边界 是 B 的 原点 进一步 移动 的 界限 ， 若 超出 该 界限 ,会 导致 结构 元 不 再 完全 包含 于 4 中 。 这 样 ,该 边 
E de 我 们 在 图 9.4 (c) 中 使 用 阴影 显示 了 该 腐蚀 的 
结果 。 记 住 , 腐蚀 是 简单 地 满足 式 (9.2-1) 或 式 (9.2-2) 的 = ee ere 
集合 4 的 边界 仅 供 参 考 ， 它 不 是 腐蚀 操作 的 一 部 分 。 图 9.4 (d) 显示 了 一 个 拉 长 的 结构 元 ， 


示 了 该 结构 元 对 集合 4 的 腐蚀 。 注 意 ， 厚 来 的 集合 已 被 腐蚀 为 一 条 直线 。 


图 O A A 和 于 的 天 人 全 人 全 背景 显示 为 白色 。 图 9.4 (c) 中 的 实 线 


图 9.4(e 
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图 9.4 pee (b) 方 形 结构 元 B; (e)B 对 4 的 腐蚀 ， 如 阴影 部 分 所 示 ; (d) 拉 长 的 结构 元 ; 


e) 用 拉 长 后 的 结构 元 B 对 4 的 腐蚀 。(c) File) 中 的 虚线 边界 是 集合 4 的 边界 ， 仅 供 参考 而 显示 


式 (9.2-1) 和 式 (9.2-2) 不 是 腐蚀 的 唯一 定义 形式 (见习 题 9.9 和 习题 9.10 中 另外 两 种 等 
式 ) 。 然 而 , 这 些 公 式 较 之 其 他 公式 具有 独特 的 优点 
它们 更 直观 


车 价 的 定义 形 
, 即 把 结构 元 B 视 为 一 个 空间 模板 时 ( 见 3.4.1 49) , 


例 9.1 使 用 腐蚀 去 除 图 像 的 某 些 部 分 。 

假设 我 们 希望 去 掉 图 9.5 (a) 中 连接 中 心 区 域 到 边界 焊接 点 的 线 。 使 用 一 个 大 小 为 11x11 且 元 素 都 是 1 
的 方形 结构 元 腐蚀 该 图 像 ， 如 图 9.5 (b) 所 示 ， 大 多 数 为 1 的 线条 都 被 去 除 。 位 于 中 心 的 两 条 垂直 线 被 细 
化 , 但 未 被 完全 去 除 , 原因 是 它们 的 宽度 大 于 11 个 像素 。 把 SE 的 大 小 改 为 15x15, 并 再 次 腐蚀 原 图 像 ， 
如 图 9.5(c) 所 示 ， 所 有 的 连 线 都 去 除了 [ 另 一 种 方法 是 , 使 用 11x11 的 SE 对 图 9.5 (b) 的 图 像 再 进行 腐 


th ]。 增 大 结构 元 的 尺寸 甚至 会 消除 更 大 的 部 件 。 例 如 ， 使 用 大 小 为 45x45 的 结构 元 ， 可 去 除 边 界 的 焊 
接点 ， 如 图 9.5 (d) 所 示 。 


4 ; Getei 


图 9.5 ”使 用 腐蚀 去 除 图 像 中 的 部 件 : (a) 一 幅 大 小 为 486x486 的 连 线 模板 二 值 图 像 ; 
(d) 分 别 使 用 大 小 为 11x11, 15x15 和 45x45 的 结构 元 腐蚀 的 图 像 。SE 的 元 素 都 是 加 











9.2.2 BAK i 
AMBEZ PWRA, RRA AOB É BX A 的 膨胀 定义 为 
A®B={z|(B),NA#O} (9.2-3) 


这 个 公式 是 以 8 关 于 它 的 原点 的 映像 ， 并 且 以 z 对 映像 进行 平移 为 基础 ( 见 图 9.1) 。B 对 4 的 膨胀 
是 所 有 位 移 z HRA, ROR, BRA 至 少 有 一 个 元 素 是 重 倒 的 。 根 据 这 种 解释 ， 式 (9.2-3) 可 以 等 
价 地 写 为 


A®B={z|[(B).NAlc A} (9.2-4) 


与 以 前 一 样 ， 我 们 假定 B 是 一 个 结构 元 ，4 是 被 膨胀 的 集合 (图像 物体 ) 。 

式 (9.2-3) 和 式 (9.2-4) 并 不 是 当前 所 用 膨胀 的 唯一 定义 (见习 题 9.11 和 习题 9.12 中 两 种 不 同 但 等 价 
的 定义 ) 。 但 在 把 结构 元 B 视 为 一 个 卷 积 模板 时 ， 前述 定义 与 其 他 定义 形式 相 比 优点 明显 ,这 种 定义 
形式 更 直观 。B 关于 其 原点 翻转 (旋转) ， 然 后 逐步 移动 以 滑 过 整个 集合 (图 像 )4， 这 一 基本 过 程 类 似 
于 3.4.2 节 中 介绍 的 空间 卷 积 。 但 要 记 住 ， 膨 胀 以 集合 操作 为 基础 ， 因 此 是 一 种 非 线性 操作 ， 而 卷 积 
是 一 种 线性 操作 。 

与 腐蚀 不 同 ， 腐 蚀 是 一 种 收缩 或 细 化 操作 ， 脱 胀 则 会 “增长 ”或 “ 粗 化 ”二 值 图 像 中 的 物体 。 这 
种 特殊 的 方式 和 粗 化 的 宽度 由 所 用 结构 元 来 控制 。 图 9.6 (a) 显示 了 与 图 9.4 中 所 用 集合 相同 的 集合 ， 
图 9.6 (b) 显示 了 一 个 结构 元 (在 这 种 情况 下 ，B = B ， 因 为 SE 关于 其 原点 对 称 ) 。 作 为 参考 ， 图 9.6(c) 
中 的 虚线 显示 了 原始 集合 ， 实 线 显示 了 一 个 界限 ，B 的 原点 进一步 移动 z， 若 超出 这 一 界限 ， 则 导致 B 
和 4 的 交集 为 空 。 因此 ,处 在 该 边界 上 或 该 边界 内 的 所 有 点 就 构成 了 B 对 4 的 膨胀 。 图 9.6(d) 显示 了 
一 个 设计 用 来 实现 垂直 方向 膨胀 比 水 平方 向 膨胀 更 多 的 结构 元 ， 图 9.6(e) 则 显示 了 使 用 这 个 结构 元 进 
行 膨胀 的 结果 。 





ue ta) 


图 96 OREA (b) 方 形 结构 元 ( 黑 点 表示 原点 ) ;(c) 8 对 4 的 膨胀 ， 显 示 为 阴影 ，(d) 拉 长 的 结构 元 ; 
(e) 使 用 这 个 结构 元 对 4 WK. Fc) 和 图 (e) 中 的 点 线 的 边 是 集合 4 的 边界 ， 仅 作为 参考 而 显示 
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一 幅 子 图 像 来 处 理 , 而 不 是 一 幅 图 形 ) 。 图 9.7 (c) 显示 了 使 用 这 个 结构 元 对 原 图 像 进行 膨胀 后 的 结果 。 裂 颖 
已 被 连接 。 形 态 学 方法 较 之 我 们 在 图 4.49 中 用 于 连接 断裂 的 低 通 滤 波 方法 的 一 个 直接 优点 是 ， 形 态 学 方法 
可 在 一 幅 二 值 图 像 中 直接 得 到 结果 。 另 一 方面 , 低 通 滤波 方法 则 从 一 幅 二 值 图 像 开始 , 生成 一 幅 灰 度 图 像 ， 
它 需 要 用 一 个 净值 函数 将 灰 度 图 像 转 换 为 二 值 图 像 。 


abe Historically, certain computer 


programs were written using 
only two digits rather than 
four to define the applicable 
year. Accordingly, the 





company's software may 
recognize a date using "00" 
as 1900 rather than the year 


2000. 





图 9.7 (a) 具有 断裂 字符 的 低 分 辩 率 样品 文本 ( 见 放 大 的 视图 ) ; 
(b) 结构 元 ; (c) EI (b) 对 (a) 的 膨胀 。 断 裂 线段 被 连 起 来 了 
9.2.3 对偶 性 
膨胀 和 腐蚀 彼此 关于 集合 求 补 运算 和 反射 运算 是 对 偶 的 ， 即 
(AQB) = A° OB (9.2-5) 
和 
(4®B) =A4°OB (9.2-6) 
式 (9.2-5) 指 出 ，B 对 4 HUGE BoM 4° 的 膨胀 的 补 集 ， 反 之 亦 然 。 当 结构 元 关于 其 原点 对 称 时 (通常 
如 此 ) ,因为 B= B， 故 对 偶 性 特别 有 用 。 这 样 , 我 们 可 以 用 相同 的 结构 元 简单 地 使 用 B 膨胀 图 像 的 背 
景 ( 即 膨胀 4° ) ， 对 该 结果 求 补 即 可 得 到 B 对 该 幅 图 像 的 腐蚀 。 类 似 的 说 明 适 用 于 式 (9.2-6) 
为 了 说 明 建 立 形态 学 表达 式 有 效 性 的 一 种 典型 方法 ,我 们 正式 证 明 式 (9:2-5) 的 有 效 性 。 由 腐蚀 的 
EX, RIITA 
(48B) ={z|(B); c A} 
若 集 合 (8), 包含 在 集合 4 中 , WM), NL = 名， 在 这 种 情况 下 ， 上 式 变 为 
(AOB) = {z I(B), NA = Øy 
但 是 , WE (B), NA =Ø ÉI z WRR RIMENE (B), NA 2 的 z 的 集合 ， 因 此 有 
(48B) ={z|(B), NA’ + Ø} =A OB 
其 中 ， 最 后 一 步 来 自 式 (9.2-3) 。 证 毕 。 采 用 类 似 的 推理 可 以 证 明 式 (9.2-6) (见习 题 9.13) 。 


9.3” 开 操作 与 闭 操作 


如 我 们 所 见 的 那样 ， 膨 胀 会 扩大 一 幅 图 像 的 组 成 部 分 ， 而 腐蚀 则 会 缩小 一 幅 图 像 中 的 组 成 部 分 。 
本 节 讨 论 另 外 两 个 重要 的 形态 学 操作 : 开 操 作 与 闭 操作 。 开 操作 一 般 会 平滑 物体 的 轮廓 、 断 开 较 罕 的 


狭 颈 并 消除 较 细 的 突出 物 。 闭 操作 同样 也 会 平滑 轮廓 的 一 部 分 ， 但 与 开 操作 相反 ， 它 通常 会 弥合 较 窗 PPP 


的 间断 和 细 长 的 沟 完 ， 消 除 较 小 的 孔洞 ， 填 补 轮廓 线 中 的 断裂 。 
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结构 元 B 对 集合 4 RFH, RIRI AB, XWF: 

AcB=(AQB)@B (9,3-1) 
因此 ,8B 对 4 的 开 操作 就 是 B 对 4 ADR, KRE B Me RETIN. 

类 似 地 ， 用 结构 元 B 对 集合 4 的 闭 操作 ， 表 示 为 4.8 ， 定 义 如 下 : 

A.B =(A® B)OB (9.3-2) 
上 式 说 明 ，B 对 集合 4 的 闭 操作 就 是 简单 地 用 B 对 4 膨胀 ， 紧 接着 用 B 对 结果 进行 腐蚀 。 

开 操作 有 一 个 简单 的 几何 解释 ( 见 图 9.8) 。 假设 我 们 把 结构 元 B 视 为 一 个 (扁平 的 )“ 转 球 ”。 然后 ， 
AoB 的 边界 由 B 中 的 点 建立 : 当 B 在 4 的 边界 内 侧 滚动 时 , B 所 能 到 达 的 4 的 边界 的 最 远 点 。 开 操作 
的 这 种 几何 拟 合 特 性 导致 了 一 个 集合 论 公式 , 该 公式 表明 B 对 A 的 开 操作 是 通过 拟 合 到 4 的 B 的 所 有 
平移 的 并 集 得 到 的 。 也 就 是 说 ， 开 操作 可 以 表示 为 一 个 拟 合 处 理 : 

AoB=| ){(B), |(B), c A} (9.3-3) 
FUP UG} 表示 大 括号 中 所 有 集合 的 并 集 。 
A°B=U{(B),\(B), CA} abcd 





9.8 (a) HEITE B 沿 集合 4 的 内 侧 边界 滚动 ( 黑 点 表示 B 的 原点 ) ; (b) 结 构 元 ; (c) 粗 线 是 开 操 
作 的 外 部 边界 ; (O 完全 的 开 操 作 ( 阴 影 部 分 ) 。 为 清楚 起 见 ， 在 图 (a) 中 我 们 未 对 4 加 阴影 


除了 我 们 现在 是 在 边界 的 外 侧 滚动 B( 见 图 9.9) 之 外 ，, 闭 操 作 有 类 似 的 几何 解释 。 如 下 面 所 讨论 的 
那样 ， 开 操作 和 闭 操作 彼此 对 偶 ， 所 以 闭 操 作 在 边界 外 侧 滚动 球体 是 意料 之 中 的 事情 。 从 几何 上 讲 ， 
当 且 仅 当 对 包含 w AY (B), 进行 的 任何 平移 都 有 (8B), 几 4 名 时 ， 点 w 才 是 4.8B 的 一 个 元 素 。 图 9.9 说 


明了 闭 操作 这 一 基本 的 几何 性 质 。 
B 





9.9 (aA B HRA 4 的 外 侧 边 界 滚动 ; (b) 粗 线 是 闭 操作 的 外 部 边界 ; 
(c) 完全 的 闭 操作 (阴影 部 分 ) 。 为 清楚 起 见 ， 在 图 (a) 中 我 们 未 对 4 加 阴影 
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AcB=(AOB)@B 
A@B 
A TENET 
图 9.10 形态 学 开 操作 和 闭 操作 。 结 构 元 是 在 图 (b) 中 的 各 个 位 置 显 
示 的 小 圆 。 为 清楚 起 见 ，SE 未 加 阴影 。 黑 点 是 结构 元 的 中 心 
如 同 膨胀 和 腐蚀 的 情形 那样 ， 开 操作 和 闭 操 作 彼 此 关于 集合 求 补 和 反射 也 是 对 偶 的 ， 即 
(AsB)’ =(4° o Ê) (9.3-4) 
和 
(Ao BY =(A°*B) (9.3-5) 
我 们 将 该 结果 的 证 明 作为 练习 留 给 读者 (见习 题 9149)。 
开 操 作 满 足下 列 性 质 : 
(a) 4oB 是 4 的 一 个 子 集 ( 子 图 像 )。 


(b) WF CEDATE, 则 CoB 是 DoB 的 一 个 子 集 。 
(e) (40B)oB=AoB。 
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类 似 地 ， 闭 操作 满足 下 列 性 质 : 
(a) A 是 4.8B 的 一 个 子 集 ( 子 图 像 ) 。 


(b) 如 果 C 是 DD 的 一 个 子 集 ， 则 C.B 是 DB 的 一 个 子 集 。 
(c) (A:B)*B= AB 。 


注意 ， 由 两 种 情况 下 的 条 件 (c) 可 知 ， 算 子 应 用 一 次 后 ,一 个 集合 的 多 次 开 操作 或 闭 操作 没有 影响 


例 9.4 针对 形态 学 滤波 使 用 开 操作 和 闭 操 作 。 

形态 学 操作 可 用 于 构建 与 第 3 章 中 讨论 的 空间 滤波 概念 相 类 似 的 滤波 器 。 图 9.11(a) 中 的 二 值 图 像 显 
示 了 被 噪声 污染 的 指纹 图 像 的 一 部 分 。 这 里 ， 噪 声 本 身 表 现 为 黑色 背景 上 的 随机 亮 元 素 和 指纹 较 亮 部 分 上 
的 暗 元 素 。 我 们 的 目的 是 消除 噪声 及 其 对 印刷 的 影响 ， 同 时 使 图 像 的 失真 尽 可 能 小 。 由 开 操作 后 紧 跟 闭 操 
作 的 形态 学 滤波 器 可 用 来 实现 这 一 目的 。 
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SS \ te (AO B)®B=A°B 
Na (A*B)® B 
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图 9.11 (a) 噪声 图 像 ;， (b) 结构 元 ; (ec) 腐蚀 后 的 图 像 ，(d)4 的 开 操作 ; (e) 开 操作 
的 膨胀 ; (O 开 操作 的 闭 操作 ( 原 图 由 美国 国家 标准 和 技术 研究 所 提供 ) 


图 9.11 (b) 显示 了 所 用 的 结构 元 。 图 9.11 的 余下 部 分 按 步 又 顺序 显示 了 滤波 操作 。 图 9.11 (c) 显示 了 使 
用 结构 元 对 4 进行 腐蚀 的 结果 。 背景 噪声 在 开 操作 的 腐蚀 阶段 被 完全 消除 ,因为 这 种 情况 下 的 所 有 噪声 分 
量 都 比 结构 元 小 。 包 含 在 指纹 中 的 噪声 元 素 ( 黑 点 ) 的 尺寸 实际 上 却 增 大 了 。 原 因 是 当 物 体 被 腐蚀 时 ， 这 些 
元 素 在 尺寸 增 大 的 内 部 边界 。 这 种 增 大 可 通过 对 图 9.11 (0) 执行 膨胀 来 抵消 。 图 9.11 (qd) 显示 了 该 结果 ， 指 
纹 中 包含 的 噪声 分 量 的 尺寸 被 减 小 ， 或 完全 被 消除 。 
刚才 描述 的 两 个 操作 构成 了 B 对 4 的 开 操作 。 我 们 注意 到 ， 在 图 9.11 (d) 中 ， 开 操作 的 实际 效果 实 
质 上 是 从 背景 和 指纹 本 身 中 消除 所 有 了 噪声。 然而 ， 在 指纹 纹路 间 却 产生 了 新 断裂 。 为 防止 这 种 不 希望 的 
661 影响 ， 我 们 在 开 操 作 上 执行 膨胀 ， 如 图 9.11 (e) 所 示 。 大 部 分 断裂 得 以 恢复 ， 但 纹路 却 变 粗 了 ， 这 是 可 


第 9 章 形态 学 图 像 处 理 411 





9.4 击 中 或 击 不 中 变换 


形态 学 击 中 或 击 不 中 变换 是 形状 检测 的 基本 工具 。 我 们 将 借助 于 图 9.12 来 说 明 这 一 概念 。 图 9.12 
显示 了 一 个 由 三 种 形状 ( 子 集 ) 组 成 的 集合 4， 三 种 形状 分 别 由 C, D 和 EE 表示 。 图 9.12 (a) 到 (c) 中 的 阴 
影 部 分 表示 原始 集合 ， 而 图 9.12 (d) 和 (e) 中 的 阴影 部 分 显示 形态 学 操作 的 结果 。 目 的 是 找到 三 种 形状 
之 一 的 位 置 ， 壁 如 说 DD 的 位 置 。 

令 每 种 形状 的 原点 位 于 其 重心 处 。 设 D 被 一 个 小 窗口 丈 包 围 。 关 于 W 的 D 的 局 部 背景 定义 为 差 

W-D), WA 9.12 (b) HR. B 9.120) 显示 了 4 的 补 集 ， 后面 将 会 用 到 它 。 图 9.12 (d) 显示 了 用 万 对 
A 的 腐蚀 (虚线 仅 供 参考 )。 回 顾 可 知 ，D 对 A 的 腐蚀 是 万 的 原点 位 置 的 集合 ， 这 样 ，D 就 完全 包含 在 4 
中 。 换 一 种 方法 解释 AO D 在 几何 上 可 视 为 D 的 原点 的 所 有 位 置 的 集合 ,在 每 个 这 样 的 位 置 ， DD 找到 
A 中 的 一 个 匹配 ( 击 中 )。 记 住 ， 在 图 9.12 中 , 4 仅 由 三 个 不 相交 的 集合 C, D 和 五 组 成 。 














(48D)N(A8[IW- D]) — 
oe 





图 9.12 (a) 集合 4; OAO 不 和 关于 W KID Wee (WD); (co)4 的 补 集 ; 
(d) D 对 4 的 腐蚀 ; (©) (W—D)xt AS 的 腐蚀 ;人 (d) Al (e) 的 交集 ， 如 所 
希望 的 那样 ， 该 交集 显示 了 D 的 原点 的 位 置 。 黑 点 是 C, D 和 的 原点 
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图 9.12(e) 显示 了 局 部 背景 集合 ( 矿 - 记 对 了 4 的 补 集 的 腐蚀 。 图 9.12(e) 中 的 外 部 阴影 区 域 是 腐蚀 的 
部 分 ,我 们 从 图 9.12 (d) 和 (e) 注意 到 , 精确 地 拟 合 4 内 部 的 位 置 集合 是 由 DD 对 4 的 腐蚀 和 (WW-D) 对 AS 
的 腐蚀 的 交集 ， 如 图 9.12 (所 示 。 这 个 交集 正好 是 我 们 要 寻找 的 位 置 。 换 句 话 说 ， 如 果 B 表示 由 D 
及 其 背景 组 成 的 集合 ， 则 BEA 中 的 匹配 (或 匹配 集合 ) ， 表 示 为 4@8 ， 是 


A®B =(4eD)N[A© (W-D)] (9.4-1) 


我 们 可 以 通过 令 B = (B,, B,) 对 这 种 表示 法 稍微 做 些 推广 ， 其 中 B 是 由 与 一 个 目标 相 联 系 的 B 
的 元 素 构成 的 集合 ，B, 是 由 与 相应 背景 相 联系 的 B 的 元 素 构 成 的 集合 。 根 据 前 面 的 讨论 ， 
B, = D,B,=(W—D) 。 用 这 种 表示 方法 ， 式 (9.4-1) 变 为 


A@B = (AQB,)N(4°OB,) (9.4-2) 


因此 , 集合 A@B 包含 了 所 有 的 原点 , 同时 , 在 这 些 原点 处 , B ZEA 中 找到 了 一 个 匹配 ( 击 中 ) , BE A 
中 也 找到 了 一 个 匹配 。 使 用 式 (2.6-19) 中 给 出 的 差 集 的 定义 ， 及 式 (9.2-5) 中 给 出 的 腐蚀 和 膨胀 间 的 对 
偶 关 系 ， 可 将 式 (9.4-2) 写 为 


A@B =(AQB,)N(A@B,) i (9.4-3) 


然而 ， 式 (9.4-2) 更 为 直观 。 我 们 将 上 述 三 个 公式 称 为 形态 学 击 中 或 击 不 中 变换 。 

使 用 与 物体 有 关 的 结构 元 B 和 与 背景 有 关 的 结构 元 有 的 原因 ， 基 于 一 个 假设 的 定义 一 一 仅 当 两 
个 或 多 个 物体 形成 相 脱离 的 ( 断 开 的 ) 集 合 时 ， 这 些 物 体 才 是 可 分 的 。 通 过 要 求 每 个 物体 至 少 被 一 个 像 
素 宽 的 背景 所 围绕 ， 才 可 保证 这 一 假设 的 成 立 。 在 某 些 应 用 中 ,我 们 可 能 对 检测 某 个 集合 内 由 1 和 0 
组 成 的 某 些 模式 感 兴趣 ,在 这 种 情况 下 不 需要 背景 。 在 这 种 场合 , 击 中 或 击 不 中 就 简化 为 简单 的 腐蚀 。 
如 前 面 指出 的 那样 ， 腐 蚀 依然 是 匹配 的 集合 ， 但 检测 单个 物体 时 不 需要 额外 的 背景 匹配 。 这 种 简化 的 
模式 检测 方案 将 用 于 下 节 讨 论 的 某 些 算法 中 。 


9.5 一 些 基本 的 形态 学 算法 


以 前 面 的 讨论 为 基础 ,我们 现在 可 以 考虑 形态 学 的 一 些 实际 用 途 。 在 处 理 二 值 图 像 时 ,形态 学 的 主要 
应 用 之 一 是 提取 用 于 表示 和 描述 形状 的 图 像 成 分 。 特 别 是 我 们 要 考虑 提取 边界 、 连 通 分 量 、 山 壳 和 区 域 的 
骨架 的 形态 学 算法 。 我 们 还 要 探讨 几 种 经 常 与 这 些 算法 配合 使 用 的 预 处 理 或 后 处 理 方法 (对 于 区 域 填充 、 
细 化 、 粗 化 和 修剪 ) 。 在 介绍 每 种 形态 学 处 理 时 ,为 了 和 弄 清 楚 每 种 处 理 的 机 理 ， 我 们 将 在 这 一 小 节 中 广泛 
地 使 用 “迷你 图 像 "。 这 些 图 像 以 图 形 的 方式 显示 ， 用 1 表示 阴影 区 域 ， 而 用 0 表示 白色 。 


9.5.1 边界 提取 
表示 为 B(A) 的 集合 4 的 边界 可 以 通过 先 用 B 对 A 腐蚀 ， 而 后 执行 4 和 腐蚀 的 结果 之 间 的 差 集 得 
到 ， 即 
P(A)= A-(40B) : (9.5-1) 


式 中 8 是 一 个 适当 的 结构 元 。 
图 9.13 说 明了 边界 提取 的 机 理 。 这 幅 图 像 显 示 了 一 个 简单 的 二 值 物体 、 一 个 结构 元 B 和 使 用 
式 (9.5-1) 得 到 的 结果 。 尽 管 图 9.13 (b) 中 的 结构 元 最 常用 , 但 它 绝对 不 


是 唯一 的 。 例 如 ， 使 用 由 1 组 成 的 大 小 为 5x5 的 结构 元 ， 将 得 到 2~3 | ”人 现在 开始 , 我 们 将 不 再 显 式 地 给 
出 边界 填充 。 
个 像素 宽 的 边界 。 
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图 9.13 (a) 集 合 4; (b) 结 构 元 B; (c)3 对 4 的 腐蚀 ; (d) 由 A 和 其 腐蚀 间 的 差 集 给 出 的 边界 


例 9.5 用 形态 学 处 理 提 取 边 界 。 

图 9.14 进一步 说 明了 式 (9.5-1) 和 由 1 组 成 的 3x3 结构 元 的 用 途 。 如 本 章 中 的 所 有 二 值 图 像 那样 ， 二 
进 制 值 1 显示 为 自 色 ， 二 进 制 值 0 显示 为 黑色 , 因此 该 结构 元 的 元 素 1 也 被 当 作 白色 来 处 理 。 由 于 所 用 结 
构 元 的 尺寸 ,图 9.14 (b) 中 的 边界 宽度 为 1 个 像素 。 





图 9.14 (a) 一 幅 简单 的 二 值 图 像 ， 其 中 1 表示 和 白色; (b) 使 用 式 (9.5-1) 和 图 9.13 (b) 中 的 结构 元 得 到 的 结果 
9.5.2 ”孔洞 填充 


孔洞 定义 为 由 前 景 像素 相连 接 的 边界 所 包围 的 背景 区 域 。 本 节 将 针对 填充 图 像 中 的 孔洞 , 开 
发 一 种 基于 集合 膨胀 、 求 补 和 交集 的 算法 。 令 4 表示 一 个 集合 ， 其 元 素 是 8 连通 的 边界 ， 每 个 
边界 包围 一 个 背景 区 域 ( 即 一 个 孔洞 ) 。 当 给 定 每 个 孔洞 中 的 一 个 点 后 ， 目 的 就 是 用 1 填充 所 有 
的 孔洞 

除了 每 个 孔洞 中 对 应 于 XX, 中 的 位 置 给 定 的 点 之 外 (这 一 点 已 经 置 为 1 )， 我 们 从 形成 一 个 由 0 组 
成 的 阵列 Xo 开始 (该 阵列 与 包含 4 的 阵列 的 大 小 相同 ) 。 然 后 ， 如 下 过 程 将 用 1 填充 所 有 和 孔洞 

X, =(X,,OB)OA k=l, 2,3,… (9.5-2) 
stp B ÆR 9.15 (c) 中 的 对 称 结构 元 。 如 果 X, = 成 ，， 则 算法 在 迭代 的 第 大 步 结 束 。 然 后 , AX, 包 
含 所 有 被 填充 的 孔洞 。X, 和 4 的 并 集 包 含 所 有 填充 的 孔洞 及 这 些 孔 洞 的 边界 。 

如 果 左 边 不 加 限制 ， ee a 然而 ， 每 一 步 中 与 AS 的 交集 操 
作 将 把 结果 限制 到 感 兴趣 区 域内 。 这 是 我 们 如 何 制约 形态 学 处 理 以 满足 希望 特性 的 第 一 个 例子 
beeen os eng 图 9.15 的 余下 部 分 进 一 步 说 明了 式 (9.5.2) 的 机 理 。 尽 
管 该 例 中 仅 有 一 个 孔洞 ， 但 在 给 定 每 个 孔洞 区 域内 的 一 个 点 的 假设 下 ， 这 一 概念 可 用 于 任何 有 限 
数量 的 孔洞 。 

例 9.6 形态 学 孔洞 填充 。 

图 9.16(a) 显示 了 一 幅 由 内 部 带 有 黑色 点 的 白色 圆圈 组 成 的 图 像 。 这 样 的 图 像 可 以 通过 将 包含 磨 光 的 球 
体 ( 如 滚珠 ) 的 场景 用 阔 值 处 理 分 为 两 个 层次 而 得 到 。 球 体内 部 的 黑 点 可 能 是 反射 的 结果 。 我 们 的 目的 是 通 Gea 


过 孔洞 填充 来 消除 这 些 反射 。 图 9.16(a) 显示 了 在 一 个 球体 中 选择 的 一 个 点 ， 图 9.16(b) 显示 了 填充 一 部 分 | 
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的 结果 。 最 后 ,图 9.16(c) 显示 了 填充 所 有 球体 后 的 结果 。 因 为 黑 点 是 背景 点 还 是 球体 内 部 的 点 必须 是 已 知 
的 ， 所 以 完全 自动 化 这 一 过 程 要 求 在 算法 中 建立 附加 的 “智能 ”功能 。 在 9.5.9 节 中 ,我 们 将 给 出 一 种 基 
于 形态 学 重建 的 全 自动 方法 (见习 题 9.23) 。 


abicidie 
a 




















































































































| 
+ 
| 


\ 
H EEs 










































































X2 Xe Xp XgUA 


图 9.15 孔洞 填充 ; (a) 集合 4 (显示 为 阴影 ) ; (b)A 的 补 集 ; (ce) 结 构 元 8B; (d) 边界 内 
的 初始 点 ; (e)~(h) 式 (9.5-2) 的 各 个 步骤 ; 最 终结 果 [ (a) 和 (b) 的 并 集 ] 





图 9.16 (a) 二 值 图 像 ( 区 域内 部 的 白 点 是 孔洞 填充 算法 的 起 始点 ) ; 
(b) 填 充 该 区 域 后 的 结果 ; (ce) 填充 所 有 孔洞 后 的 结果 


9.5.3 连通 分 量 的 提取 
连通 性 和 连通 分 量 的 概念 已 在 2.5.2 节 中 介绍 过 。 从 二 值 图 像 中 提取 连通 分 量 是 许多 自动 图 像 分 
析 应 用 的 核心 。 令 4 是 包含 一 个 或 多 个 连通 分 量 的 集合 ， 并 形成 一 个 阵列 XX, (该 阵列 的 大 小 与 包含 4 
的 阵列 的 大 小 相同 ) ， 除 了 在 对 应 于 4 中 每 个 连通 分 量 的 一 个 点 的 每 个 已 知 位 置 处 我 们 已 置 为 1 (前景 
值 ) 外 ， 该 阵列 的 所 有 其 他 元 素 均 为 0( 背 景 值 )。 如 下 迭代 过 程 可 完成 这 一 目的 : 
TBDNA k=1 2 3 7 (9.5-3) 
式 中 ，B 是 一 个 适当 的 结构 元 (如 图 9.17 所 示 ) 。 当 成 , =X a 时 ， 和 迭代 过 程 结束 ， 马 包含 输入 图 像 中 
的 所 有 连通 分 量 。 注 意 式 (9.5-3) 与 式 (9.5-2) 的 相似 性 ， 唯 一 的 差别 是 用 AARET A 。 这 并 不 奇怪 ， 
因为 此 处 我 们 正在 寻找 前 景点 ， 而 在 9.5.2 节 的 目的 是 寻找 背景 点 。 
图 9.17 说 明了 式 (9.5-3) 的 机 理 ，k=6 时 即 可 收敛 。 注 意 ， 所 用 结 
构 元 的 形状 在 像素 间 是 基于 8 连通 的 。 如 果 我 们 用 图 9.15 中 的 SE, 它 
是 基于 4 连通 的 ， 朝 向 图 像 底部 的 连通 分 量 的 最 左 侧 元 素 将 不 会 被 检 
测 到 ， 因 为 对 图 的 其 余部 分 它 是 8 连通 的 。 如 孔洞 填充 算法 那样 ， 假 定 在 每 个 连通 分 量 内 都 已 知 一 个 
8 点 ， 式 (9.5-3) 对 于 任何 在 4 中 的 有 限 数量 的 连通 分 量 都 是 可 用 的 。 









关于 事先 不 要 求知 道 每 个 连通 分 量 
中 的 一 个 点 的 算法 ， 请 参阅 习题 924 | 
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x, f E? x, 
图 9.17 ”提取 连通 分 量 : (a) 结 构 元 ; \b) 包 含有 一 个 连通 分 量 的 集合 的 阵列 ; (c) 在 连通 
分 量 的 区 域 中 包含 一 个 1 的 初始 阵列 ; (d)~(g) 式 (9.5-3) 的 各 个 迭代 步骤 


例 9.7 使 用 连通 分 量 检测 包装 食品 中 的 外 来 物 。 

连通 分 量 经 常用 于 自动 检测 。 图 9.18 (a) 显示 了 一 幅 含 有 碎 骨 的 鸡 胸 X 射线 图 像 。 经 过 处 理 的 食品 在 
包装 和 /或 运送 之 前 能 检测 出 这 样 的 物体 是 很 有 意义 的 。 在 这 种 特殊 情况 下 , 骨骼 的 密度 使 得 它们 的 正常 灰 
度 值 与 背景 不 同 。 这 就 使 得 使 用 单一 阔 值 ( 阔 值 处 理 在 3.1 节 介 绍 过 ，10.3 节 中 将 进行 更 详细 的 讨论 ) 将 骨 
骼 从 背景 中 提取 出 来 非常 简单 。 结 果 是 图 9.18 (b) 所 未 的 二 值 图 像 。 

这 幅 图 中 的 最 显著 特征 是 保留 下 来 的 点 聚集 为 物体 (骨头 ) ， 而 不 是 彼此 孤立 的 毫 无 关系 的 点 。 我 们 可 
以 确定 ， 只 有 具有 “有 效 ” 尺 二 的 物体 才能 对 经 国 值 处 理 的 图 像 进行 腐蚀 后 而 保留 下 来 。 在 这 个 例子 中 ， 
我 们 将 “有 效 ” 尺 寸 的 物体 定义 为 : 使 用 元 素 为 1、 大 小 为 5x5 的 结构 元 腐蚀 图 像 后 保留 下 来 的 任何 物体 . 
图 9.18(c) 中 显示 了 腐蚀 的 结果 。 下 一 步 是 分 析 保 留 下 来 的 物体 的 尺寸 。 我 们 通过 提取 图 像 中 的 连通 分 量 来 
标记 (识别 这 些 物 体 ,。 图 9.18(d) 中 的 表格 列 出 了 提取 的 结果 。 总 共有 15 个 连通 分 量 ， 其 中 4 个 尺寸 较 大 。 这 
足以 确定 包含 在 原 图 像 中 的 重要 但 不 希望 的 物体 。 如 果 需 要 ,可 使 用 第 11 章 讨论 的 技术 进一步 描述 其 特性 
(比如 物体 的 形状 ) 。 


ab 
cd 





图 9.18 ” (a) 含有 碎 骨 的 鸡肉 XX 射线 图 像 ;(b) 经 立 值 处 理 后 的 图 像 ;(c) 使 用 元 素 为 1、 
大 小 为 5x5 的 结构 元 腐蚀 后 的 图 像 ; (d) 图 (c) 的 连通 分 量 中 的 像素 数 (图 像 由 


NTB Elektronische Geraete GmbH, Diepholz, Germany, www.ntbxray.com 提供 ) 
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如 果 在 集合 4 内 连接 任意 两 个 点 的 直线 段 都 在 4 的 内 部 , 则 称 集合 4 IBA. 任意 集合 S Hse H 
是 包含 于 5 的 最 小 凸 集 。 差 集 互 -8 称 为 8 的 凸 缺 -如 了 .1.6 节 和 11.3.2 节 中 详细 讨论 的 那样 ， 凸 这 和 凸 
缺 对 于 物体 描绘 是 很 有 用 的 。 这 里 ， 我 们 介绍 一 种 获得 集合 4 的 凸 壳 CC) 的 简单 形态 学 算法 。 
令 B',i= 1,2,3,4 表示 图 9.19 (a) 中 的 4 个 结构 元 。 这 个 过 程 可 通过 执行 下 式 实现 : 
Xi =(X,_,@B')UA i=1, 2, 3, 4 Al k=1, 2 3 (9.5-4) 
st, Xi =A. MARA E X = xih, RIS D' = XX: 。 则 4 的 凸 壳 为 


C(A) = Uo (9.5-5) 
i=l 
换 句 话说 ,该 方法 由 反复 使 用 好 对 4 做 击 中 或 击 不 中 变换 组 成 ; 不 再 发 生 进 一 步 变化 时 , 我 们 执行 与 
4 的 并 集运 算 , 结果 称 为 D's 这 一 过 程 使 用 B? 重复 (应 用 于 A), 直到 不 发 生 进 一 步 的 变化 , 如 此 往复 。 
得 到 的 4 个 DD 的 并 集 组 成 了 4 的 凸 壳 。 注意 , 我 们 使 用 不 需要 背景 匹配 的 击 中 或 击 不 中 变换 的 简化 实 
现 ， 如 9.4 节 末 尾 所 讨论 的 那样 。 

图 9.19 说 明了 式 (9.5-4) 和 式 (9.5-5) 给 出 的 过 程 。 图 9.19 (a) 显示 了 用 于 提取 凸 壳 的 结构 元 。 每 个 
结构 元 的 原点 均 位 于 其 中 心 处 。“x” 项 表示 “不 考虑 ”的 条 件 。 这 意味 着 ， 如 果 结 构 元 模板 下 4 的 3x3 
区 域 在 该 位 置 匹配 模板 的 模式 ， 则 说 结构 元 在 4 中 找到 了 一 个 匹配 。 对 于 一 个 特殊 的 模板 ， 当 4 中 的 这 
个 3x3 区 域 的 中 心 为 0 时 ， 阴 影 模 板 元 素 下 的 3 个 像素 为 1 时 ， 才 会 出 现 模式 匹配 。 不 必 顾 及 这 个 3x3 
区 域内 其 他 像素 的 值 。 此 外 ， 图 9.19 (a) 中 的 符号 B' 是 由 B” 顺 时 针 旋转 90* 得 到 的 。 

































































图 9.19”(a) 结 构 元 ; (b) 集合 4; (c)~(D 使 用 图 (a) 中 的 结构 元 得 到 的 
收敛 结果 ; (g) Fe; (h) 显示 了 每 个 结构 元 的 贡献 的 凸 壳 


图 9.19 (b) 显示 了 一 个 寻找 凸 壳 的 集合 4. 从 如 = 4 开始 , 式 (9.5-4) 经 过 4 次 迁 代 后 ,得 到 图 9.19(c) 
中 的 集合 。 然 后 令 XX = 4 ， 并 再 次 使 用 式 (9.5-4) ,得 到 图 9.19(d) 中 的 集合 (在 这 种 情况 下 , 仅 经 过 两 步 
即 可 收敛 ) 。 接 下 来 的 两 个 结果 是 以 同样 的 方式 得 到 的 。 最 后 ， 图 9.19(c), (d), (e) AO 中 集合 形成 的 并 

6) 集 得 到 图 9.19 (8) 显示 的 凸 壳 。 每 个 结构 元 的 贡献 突出 显示 在 图 9.19 W 所 示 的 组 合集 合 中 。 
670 上 述 过 程 的 一 个 明显 的 缺点 是 ， 凸 壳 可 能 超出 确保 凸 性 所 需 的 最 小 尺寸 。 减少 这 种 影响 的 一 种 简 
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单方 法 是 限制 生长 ， 以 便 凸 这 不 会 超过 初始 点 集 在 水 平和 垂直 方向 上 的 尺寸 。 对 图 9.19 中 的 例子 施加 
这 种 限制 产生 图 9.20 所 示 的 图 像 。 更 复杂 的 边界 可 用 于 进一步 限制 
具有 更 多 细节 的 图 像 的 生长 。 例 如 ， 我 们 可 以 沿 垂 直 、 水 平和 对 
角 线 方向 使 用 原始 点 集 的 最 大 尺寸 。 这 样 的 改进 所 付出 的 代价 是 ， 
































额外 增加 了 算法 的 复杂 性 和 计算 需求 。 
95.5 ” 细 化 
结构 元 B 对 集合 4 的 细 化 可 表示 为 4@B， 它 可 以 根据 击 中 
或 击 不 中 变换 来 定义 : 图 9.20 ”将 凸 沉 生长 算法 限制 到 原 
AQB = A-(A@B) = AN(A@B)' (9.5-6) 始点 集 沿 垂直 方向 和 水 平 
如 前 _ 节 那样 , 我 们 仅 对 与 结构 元 的 模式 匹配 感 兴趣 , 所 以 在 击 中 或 和 
击 不 中 变换 中 没有 背景 运算 。 对 称 地 细 化 4 的 一 种 更 有 用 表达 方式 是 以 结构 元 序列 为 基础 的 : 
{B} = {B', DB2，B3，… , B"} (9.5-7) 
IXP Bi FE 8 局 旋转 后 的 形式 。 使 用 这 一 概念 ， 我 们 现在 可 以 使 用 一 个 结构 元 序列 将 细 化 定义 为 
AQ@{B} =((---((A@ B') @ B’)---)@B") (9.5-8) 


这 种 处 理 是 4 被 好 细 化 一 次 ， 然 后 ， 得 到 的 结果 被 及 细 化 一 次 ， 如 此 进行 下 去 ， 直 到 4 BKB" 细 化 一 
次 。 整 个 过 程 不 断 重复 ， 直 到 得 到 的 结果 不 再 发 生变 化 。 每 次 单独 的 细 化 均 使 用 式 (9.5-6) 来 执行 。 
图 9.21 (a) 显示 了 一 组 通常 用 于 细 化 的 结构 元 ， 图 9.21 (b) 显示 了 将 要 使 用 刚才 讨论 的 过 程 来 细 化 
的 集合 4。 图 9.21(c) 显示 了 4 被 及 细 化 一 次 后 得 到 的 结果 。 图 9.21(d) 到 (k) 显示 了 用 其 他 结构 元 细 
化 多 次 的 结果 。 使 用 BS 进行 第 二 次 细 化 后 得 到 了 收敛 的 结果 。 图 9.21(D 显示 了 细 化 的 结果 。 最 后 ， 
图 9.21 (m) 显示 了 转换 为 m 连通 的 细 化 集合 ( 见 2.5.2 节 ) ， 以 消除 多 重 路 径 。 
原 



































a 
a eC "= 





Ags = Aq, ® BS naan 

此 后 不 再 变化 

图 9.21  (a) 用 于 细 化 的 经 旋转 后 的 结构 元 序列 ; ORAA (ec) 使 用 第 一 个 结构 元 
细 化 得 到 的 结果 ; (d)~ (使 用 接 下 来 的 7 个 结构 元 细 化 得 到 的 结果 (使 用 第 7 

个 和 第 8 个 结构 元 细 化 得 到 的 结果 间 没 有 变化 ) ; 0) 再 次 使 用 前 4 个 结构 元 

细 化 得 到 的 结果 ; (1) 收敛 后 的 结果 ; (m) 转换 为 六 .连通 的 结果 


已 转 换 为 m 连 通 的 Age 
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95.6 粗 化 
粗 化 是 细 化 的 形态 学 对 偶 ， 定 义 如 下 : 
A-B = AU(A@B) (9.5-9) 
式 中 四 是 适合 于 粗 化 处 理 的 结构 元 。 与 细 化 一 样 ， 粗 化 处 理 也 可 以 定义 为 一 个 系列 操作 ; 
AQ {B} = ((---((A@B')OB’)--:) OB") (9.5-10) 


用 于 粗 化 的 结构 元 与 图 9.21 (a) 所 示 的 结构 元 具有 相同 的 形式 , 但 所 有 1 和 0 要 互 换 。 然而 , 针对 粗 化 
的 分 离 算 法 在 实际 中 很 少 用 到 ， 取 而 代 之 的 过 程 是 先 对 问题 中 集合 的 背景 进行 细 化 ， 而 后 对 结果 求 补 
集 。 换 句 话 说， 为 粗 化 集合 4， 我 们 先 形 成 C = 4 ， 而 后 细 化 C， 然 后 再 求 C* o K 9.22 说 明了 这 一 
过 程 。 

由 于 依赖 于 4 的 性 质 ， 这 个 过 程 可 能 会 产生 某 些 断 点 ， 如 图 9.22(d) 所 示 。 因 此 ， 通 过 这 种 方法 
的 粗 化 处 理 通常 会 跟随 一 个 消除 断 点 的 后 处 理 。 注意, 根据 图 9.22 (c) 可 知 , 细 化 后 的 背景 形成 了 粗 化 
处 理 的 一 个 边界 。 这 一 有 用 的 特性 在 使 用 式 (9.5-10) 粗 化 的 直接 执行 中 并 不 存在 ， 并 且 它 是 使 用 背景 
细 化 来 实现 粗 化 的 主要 原因 之 一 。 




















图 9.22 (a) SET A; (b)4 的 补 集 ; (ce) 对 4 的 补 集 进行 细 化 得 到 的 结果 ; 
(d) 对 (c) 求 补 得 到 的 粗 化 后 的 集合 ; (e) 没 有 断 点 的 最 终结 果 


9.5.7 骨架 
如 图 9.23 Pras, RA A 的 骨架 5(4) 的 概念 很 简单 。 由 该 图 我 们 可 以 推出 : 


(a) 如 果 z 是 5S(4) 的 一 个 点 , 并 且 (D), 是 4 内 以 z 为 中 心 的 最 大 圆 盘 ， 则 不 存在 包含 (D). BAF 
4 内 的 更 大 圆 盘 (不 必 以 z HO. MEOD), PARADA. 
(b) [BE (D), 在 两 个 或 多 个 不 同 的 位 置 与 4 的 边界 接触 。 


A 的 骨架 可 以 用 腐蚀 和 开 操 作 来 表达 ， 即 骨架 可 以 表示 为 (Serra[1982]) 


K 
SA =| S4 (9.5-11) 
k=0 
其 中 ， 
S (A) = (AQ kB)—(A@ kB) B (9.5-12) 
式 中 ,8 是 一 个 结构 元 ,而 (4© kB) 表示 对 A 的 连续 上 次 腐蚀 : 
(AOKB) =((…(488)eB)e.…)©8) (9.5-13) 






672] KE A 被 腐蚀 为 空 集 前 的 最 后 一 次 迭代 步骤 。 换 句 话 说 ， 
674 K = max {k | (AQKB) + Ø} (9.5-14) 
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YY 


19.23 (a) 集合 A; (b) 中 心 在 4 的 骨架 上 的 最 大 圆 盘 的 不 同位 置 ; (c) 位 
于 4 的 骨架 的 不 同 线段 上 的 另 一 个 最 大 圆 盘 ; (d) 完整 的 骨架 
式 (9.5-11) 和 式 (9.5-12) 给 出 的 公式 表明 ，S(4) 可 以 作为 骨架 子 集 5; (4) 的 并 集 来 得 到 。 此 外 ， 还 
可 证 明 使 用 下 式 可 由 这 些 子 集 来 重建 A: 





K 
A=|J(S,(A)@4B) (9.5-15) 
k=0 


SUF (S, (A) ® kB) ZAM S, (A) 的 大 次 连续 膨胀 ， 即 
(5S, (A) DKB) = ((---((S, (A) ® B)® B) @---) @ B) (9.5-16) 


























图 9.24 式 (9.5-11) 到 式 (9.5-15) 的 执行 。 原 始 集合 位 于 左上 角 ， 其 
形态 学 骨架 位 于 第 四 列 的 底部 。 第 六 列 底部 为 重建 的 集合 
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”第 四 列 包 含 两 部 分 绷 架 和 最 终结 果 (该 列 的 底部 ) 。 最 终 得 到 的 骨架 不 仅 比 需要 的 更 粗 ,而 且 更 重要 的 
连通 的 。 由 于 在 前 述 的 形态 学 骨架 公式 中 没有 任何 条 件 保证 连通 性 ， 所 以 该 结果 是 意料 之 中 的 。 

定 集合 的 腐蚀 和 开 操作 中 产生 一 个 精致 的 公式 。 然 而 ， 如 同 通常 情况 下 一 样 ， 骨 架 要 求 最 大 限 
受到 的 腐 他 最 小 ， 因此 需要 像 111.7 节 中 探讨 的 算法 这 一 类 有 试探 性 的 公式 。 
A),Si(A)@B 和 (S,(A)® 2B) = (S,(A)® B)@B - 最 终 ， 最 后 一 列 品 示 了 根据 式 (9.5- 15) 
合 4， 该 集合 是 第 五 列 所 示 膨 胀 后 的 骨架 子 集 的 并 集 。 


95.8 裁剪 


裁剪 方法 本 质 上 是 对 细 化 和 骨架 算法 的 补充 , 因为 这 些 过 程 会 保留 某 些 寄生 成 分 , 因而 需要 
用 后 处 理 来 清除 这 些 寄 生成 分 。 我 们 首先 探讨 裁剪 问题 ， 然 后 以 前 面 小 节 中 介绍 的 内 容 为 基础 
探讨 一 种 形态 学 上 的 解决 方法 。 因 此 ， 我 们 将 说 明 如 何 联合 使 用 已 讨论 的 几 种 技术 来 解决 这 一 
问题 。 

在 手写 字符 的 自动 识别 中 ,通常 使 用 的 方法 是 分 析 每 个 字符 的 骨架 形状 。 这 些 骨 架 经 常 带 有 许多 
“毛刺 ” (寄生 成 分 ) 。 毛 刺 是 在 腐蚀 过 程 中 由 组 成 字符 的 笔画 的 不 均匀 性 造成 的 。 为 处 理 这 一 问题 ， 
我 们 将 探讨 一 种 形态 学 技术 ， 先 假定 寄生 成 分 的 长 度 不 超过 指定 的 像素 数 。 

图 9.25 (a) 显示 了 手写 字符 “a” 的 骨架 。 该 字符 最 左 侧 的 寄生 成 分 就 是 我 们 要 消除 的 部 分 。 解 决 
方案 是 通常 不 断 删除 寄生 分 支 的 终点 来 抑制 寄生 分 支 。 当 然 ， 这 也 会 使 得 字符 的 其 他 分 支 变 短 (或 删 
除 ) , 但 在 缺乏 其 他 结构 信息 的 情况 下 ,这 个 例子 中 的 假设 是 任何 具有 564 | 
三 个 或 小 于 三 个 像素 长 度 的 分 支 都 将 被 删除 。 使 用 一 系列 仅 设 计 用 来 |、 和 0 区 庆 的 让 RA 
检测 端点 的 结构 元 ， 对 输入 集合 4 进行 细 化 可 以 得 到 期 望 的 结果 = 也 | 图 925(b) 或 (@ 中 的 任何 排列 。 
就 是 说 ， 令 

















X, = A@{B} (9.5-17) 
式 中 ，{B} 表 示 图 9.25 (b) 和 (c) 中 所 示 的 结构 元 序列 [ ILIR (9.5-7) 的 结构 元 序列 ]。 这 个 结构 元 序列 由 
两 种 不 同 的 结构 组 成 ， 每 种 结构 对 全 部 8 个 元 素 旋 转 90°. FEI 9.25 (b) 中 的 “x ae 不 必 考 虑 ” 
的 条 件 ， 在 这 种 意义 上 ,该 位 置 上 的 像素 的 值 是 0 还 是 1 无 关 紧 要 。 在 有 关 形 态 学 的 文献 中 ， 报 告 的 
许多 结果 都 是 以 运用 类 似 图 9.25(b) 中 的 单一 结构 元 为 基础 的 ， 只 是 沿 整个 第 一 列 有 “不 必 考 虑 ”的 条 
件 而 已 。 这 是 不 完善 的 。 例 如 ， 该 元 素 将 位 于 图 9.25 (a) 中 第 8 行 、 第 4 列 的 点 识别 为 端点 ， 因 此 将 该 
点 消除 ， 从 而 破坏 了 笔画 的 连续 性 。 
连续 对 4 应 用 式 (9.5-17) 三 次 ,得 到 图 9.25(d) 中 的 集合 X 。 下 一 步 是 将 字符 “复原 ”为 原来 
的 形状 ,但 要 去 掉 寄生 分 支 。 为 做 到 这 一 点 ,首先 需要 求 形成 一 个 包含 了 中 所 有 端点 的 集合 哟 [ 见 
9.25 (e) |: 


8 
X, =(J(%, @2*) (9.5-18) 
k=l 


式 中 ，B* 是 图 925 (b) 和 (6) 中 所 示 的 相同 端点 检测 子 。 下 一 步 是 用 集合 4 作为 限定 器 ,对 端点 进行 三 
次 膨胀 : 
=(X,@0H)NA (9.5-19) 
式 中 , HETEREN 1 的 3x3 结构 元 ， 且 在 每 一 步 之 后 都 要 与 4 求 交 一 一 - 
集 。 如 区 域 填充 和 提取 连通 分 量 的 情况 - 样 ， 这 种 有 条 件 的 膨胀 可 以 |， 汪汪 人 和 
TI 防止 在 我 们 关注 的 区 域外 产生 值 为 1 的 元 素 ， 如 图 925 (O 所 示 结 果 证 
o 明 的 那样 。 最 后 ，X, AIX, 的 并 集 就 是 我 们 想 要 的 结果 : 
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X, =A, (9.5-20) 
如 图 9.25 (g) 所 示 。 
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B', B?, B’, B* (已 旋转 90°) 


























B5, B°, B’, BS( 已 旋转 90°) 














































































































































































































图 9.25 (a) 原 图 像 ; (b)~(c) 用 于 检测 端点 的 结构 元 ; (d) 经 过 三 轮 细 化 后 的 结果 ; 
(e) 图 (d) 的 端点 ; CE) 以 图 (a) 为 条 件 的 端点 膨胀 ; 〈g) 修剪 后 的 图 像 


在 更 复杂 的 情况 下 ， 使 用 式 (9.5-19) 有 时 会 捡 回 某 些 寄生 分 支 的 “尖端 "。 当 这 些 分 支 的 端点 离 骨 
架 很 近 时 ， 就 会 发 生 这 种 情况 。 尽 管 使 用 式 (9.5-17) 可 以 消除 它们 ， 但 在 膨胀 过 程 中 会 再 次 捡 回 这 些 
点 ， 因 为 它们 是 4 中 的 有 效 点 。 除 非 整个 寄生 元 素 再 次 被 捡 回 (这 些 元 素 比 有 效 笔 画 短 的 情况 很 少 ) ， 
否则 检测 并 消除 它们 就 很 容易 ， 因 为 它们 都 是 不 连续 的 区 域 。 

此 时 的 一 种 自然 想法 是 ,一定 存 在 一 种 更 为 容易 的 方法 来 解决 这 个 问题 。 例 如 ， 我 们 可 以 保留 所 
有 被 删除 点 的 轨迹 ， 并 将 其 中 合适 的 点 与 那些 应 用 式 (9.5-17) 后 留 下 的 端点 进行 再 连接 。 这 样 的 选择 
是 可 行 的 ,但 前 面 给 出 的 公式 的 优点 是 ， 使 用 简单 的 形态 学 结构 即 可 解决 整个 问题 。 在 实际 情况 下 ， 
当 这 一 组 工具 可 用 时 ， 其 优点 是 不 必 写 新 的 算法 。 我 们 只 需 将 必要 的 形态 学 函数 结合 到 操作 序列 中 。 


95.9 ”形态 学 重建 


迄今 为 止 讨论 的 形态 学 概念 只 涉及 一 幅 图 像 和 一 个 结构 元 。 本 节 讨 论 一 种 称 为 形态 学 重建 的 强大 
形态 学 变换 ， 它 涉及 两 幅 图 像 和 一 个 结构 元 。 一 幅 图 像 是 标记 ， 它 包含 变换 的 起 始点 ， 另 一 幅 图 像 是 
模板 ， 它 用 来 约束 该 变换 。 结 构 元 用 来 定义 连接 性 ”。 








D 在 关于 形态 学 重建 的 许多 文献 中 ,默认 情形 下 结构 元 假设 是 各 向 同性 的 ， 且 一 般 称 为 初级 各 向 同性 结构 元 。 在 本 章 的 上 下 文中 ， | 一。 
这 样 的 一 个 结构 元 的 例子 是 其 原点 在 中 心 处、 元 素 为 ! 且 大 小 为 3x3 的 阵列 。 
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测 地 膨胀 和 腐蚀 
形态 学 重建 的 核心 是 测 地 膨胀 和 测 地 腐蚀 这 两 个 概念 。 令 下 表 示 标 记 图 像 ，G 表示 模板 图 像 。 在 
本 讨论 中 ， 假 定 两 幅 图 像 都 是 二 值 图 像 ， 且 已 EG 。 SDV (F) 表示 大 小 为 1 的 标记 图 像 关 于 模板 的 
测 地 膨胀 ， 定 义 为 
DY (F) =(F ®B)NG (9,5-21) 
其 中 ,nn 表示 集合 的 交集 [ 这 里 由 可 解释 为 逻辑 AND (49), AA Xt AERARMEA HSC HE Ae 
AND 操作 是 相同 的 ]。F 关 于 G 的 大 小 为 n 的 测 地 膨胀 定义 为 
D® (F)= DD [ Dy) | (9,5-22) 


RP, DO(F)=F 。 在 这 个 递 推 表 达 式 中 ， 式 (9.5-21) 中 的 集合 求 交 在 每 一 步 中 都 执行 "。 注 意 ， 交 
集 算 子 保证 模板 G 将 限制 标记 的 生长 (膨胀 )。 图 9.26 显示 了 一 个 大 小 为 1 的 测 地 膨胀 的 简单 例子 。 
图 中 的 步骤 是 式 (9.5-21) 的 直接 执行 。 
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模板 , G 
图 9.26 测 地 膨胀 的 说 明 


类 似 地， 标记 已 关于 模板 G 的 大 小 为 1 的 测 地 腐蚀 定义 为 


EW(F)=(F©B)UG (9.5-23) 
式 中 ，U 表示 集合 的 并 集 ( 或 OR 操作 ) 。F 关 于 G 的 大 小 为 n 的 测 地 腐蚀 定义 为 
EL? (F)= EP | EE) (9.5-24) 


Pp, EO (F)=F . 3095-23) 中 的 并 集 操 作 在 每 个 迭代 步骤 中 执行 ， 并 保证 一 幅 图 像 的 测 地 腐蚀 仍 
然 大 于 等 于 其 模板 图 像 。 如 从 式 (9.5-21) 和 式 (9.5-23) 预期 的 那样 ， 测 地 膨胀 和 测 地 腐蚀 关于 集合 的 补 
集 对 偶 (见习 题 9.29) 。 图 9.27 显示 了 一 个 大 小 为 1 的 测 地 腐蚀 的 简单 例子 。 图 中 的 步骤 是 直接 执 
行 式 (9.5-23) 。 

有 限 数量 图 像 的 测 地 膨胀 和 腐蚀 经 过 有 限 数量 的 迭代 步 又 后 总 会 收 化 ， 因 为 标记 图 像 的 扩散 或 收 
缩 受 模板 约束 。 


D 尽管 使 用 递归 公式 来 开发 形态 学 重建 方法 更 为 直观 (就 像 此 处 所 做 的 那样 ) ， 但 它们 的 实际 实现 通常 基于 计算 上 更 有 效率 的 算法 
(例如 ， 见 Vincent[1993] 和 Soille[2003]) 。 本 节 中 所 有 基于 图 像 的 例子 均 是 使 用 这 样 的 算法 生成 的 。 
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图 9.27 测 地 腐蚀 的 说 明 


用 膨胀 和 腐蚀 的 形态 学 重建 


基于 前 面 的 概念 , 来 自 标 记 图 像 斑 对 模板 图 像 G 的 膨胀 形态 学 重建 表示 为 RE (F), 它 被 定义 为 下 

关于 G 的 测 地 膨胀 ， 反复 迭代 直至 达到 稳定 状态 ; B 
RZ (F) = DY (F) (9.5-25) 
迭代 k 次 , EZDP(F)=DEEF). 

图 9.28 说 明了 使 用 膨胀 的 重建 ,图 9.28 (a) 继续 在 图 9.26 中 开始 的 处 理 ; 也 就 是 说 ,得 到 DY (F) 后 ， 
重建 的 下 一 步 是 膨胀 该 结果 ， 然 后 用 模板 G 与 其 相 “ 与 ”(AND) 得 到 D8 (F) ， 如 图 9.28 (b) 所 示 。 
DE (F) 的 膨胀 结果 与 模板 G 相 “ 与 ”(AND) 得 到 D8,(F) ， 等 等 。 重复 这 一 过 程 ， 直 至 达到 稳定 。 
如 果 我 们 对 该 例 多 执行 一 步 ， 会 发 现 D8)(F)= DL(F) ， 因 此 ， 采 用 膨胀 的 形态 学 重建 的 图 像 由 
D8(F)= DỌ (F) 4th, 这 正如 式 (9.5-25) 指 出 的 那样 。 注意 , 在 这 种 情况 下 , 重建 的 图 像 与 模板 相同 ， 


因为 F 包含 了 值 为 1 的 单个 像素 (类 似 于 一 幅 图 像 与 一 个 冲 激 的 卷 积 ， 该 卷 积 简单 地 复制 冲 激 位 置 处 
的 图 像 ， 如 在 3.4.2 节 解 释 的 那样 ) 。 






























































































































































sh cn a a a a | 
被 8 膨胀 的 D3F) DP) BBEKKD (F) D(F) = Re (F) 


图 9.28 采用 膨胀 的 形态 学 重建 的 说 明 。 FG,B A DY (F) KAR 9.26 


依照 类 似 的 方法 ， 模 板 图 像 G 对 标记 图 像 的 腐蚀 的 形态 学 重建 表示 为 RE(F) ， 它 被 定义 为 F 
关于 G 的 测 地 腐蚀 ， 反 复 迭 代 直 至 达到 稳定 状态 ; BY i 


RE(F)=E® (F) l (9.5-26) 
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BARAK, 直至 BDICP) = ES™"(F) 。 作 为 习题 ， 请 读者 针对 腐蚀 的 形态 学 重建 生成 一 幅 类 似 于 图 9.28 
的 图 形 。 膨 胀 和 腐蚀 形态 学 重建 关于 集合 补 集 对 偶 ( 见 习题 9.30) 

应 用 实例 

形态 学 重建 有 很 宽 的 实际 ) ei 领域 , 每 种 应 用 都 由 标记 图 像 和 模板 图 像 的 选择 、 所 用 的 结构 元 及 
前 面 讨论 中 定义 的 基本 操作 的 组 合 来 决定 。 下 面 的 几 个 例子 说 明了 这 些 概念 的 应 用 

重建 开 操 作 : 在 形态 学 开 操 i 中 ， 腐 蚀 会 删除 小 的 物体 ， 而 后 续 的 膨胀 会 试图 恢复 遗留 物体 的 形 
状 然而 ， 这 种 恢复 的 准确 性 高 度 依赖 于 物体 的 形状 和 所 用 结构 元 的 相似 性 。 重 建 开 操作 可 正确 地 恢 

复 腐蚀 后 所 保留 物体 的 形状 。 图 像 己 的 大 小 为 半 的 重建 开 操 作 ， 定 义 为 来 自己 的 大 小 为 半 的 腐蚀 的 书 
的 有 AK; BI 
OW (F) = RA[(F©nB)] (9.5-27) 
AH, (FOnB) KIR B X} F H n VBR, 9.5.7 节 中 解释 的 那样 。 注 意 ， 在 该 应 用 中 , F 被 用 作 模 
板 。 对 于 重建 闭 操作 ， 可 写 出 一 个 类 似 的 表达 式 ( 见 表 9.1) 。 

图 9.29 显示 了 重建 开 操作 的 一 个 例子 。 在 这 一 说 明 中 ， 我 们 的 兴趣 是 从 图 9.29 (a) 中 提取 垂直 笔画 
的 长 字符 。 重 建 开 操 作 至 少 要 求 一 次 腐蚀 ， 因 此 我 们 首先 执行 这 一 步骤 。 图 9.29 (b) 显示 了 图 9.29 (a) 经 腐 
伺 后 的 结果 , 该 腐蚀 采用 长 度 与 长 字符 的 (51 个 像素 ) 平 均 高 | oe 正比 和 宽度 为 1 个 像素 的 结构 元 。 为 了 
比较 , 我 们 用 相同 的 结构 元 计算 了 开 操 作 。 图 9.29 (c) 显示 了 结果 。 最 后 , 图 9.29 (d) 是 用 式 (9.5-27) 中 给 
IHÉS F [ETOP (F) ] 的 重建 开 操作 (大 小 为 1) 。 该 结果 表明 ， 包 含 垂 直 笔 画 的 长 字符 被 准确 地 恢复 ， 
而 所 有 其 他 字符 则 被 去 除 。 


ponents or broken connection paths. There is no poi 


ab 
ed 
图 9.29 ” (a) 大 小 为 918x2018 像素 的 文本 图 像 。 长 的 字符 的 近似 平均 高 度 是 
51 个 像素 ; (b) 使 用 大 小 为 51x1 像素 的 结构 元 对 图 (a) 的 腐蚀 ; (c) 使 
用 相同 的 结构 元 对 图 (a) 的 开 操作 ， 用 做 参考 ; (d) 重建 开 操作 的 结果 
填充 孔洞 : 在 9.5.2 节 中 ,我 们 开发 了 一 种 填充 孔洞 的 算法 ， 该 算法 在 图 像 的 每 个 孔洞 中 都 已 知 
一 个 起 始点 。 这 里 ， 我 们 开发 一 个 基于 形态 学 重建 的 全 自动 化 过 程 。 令 I, y) 代 表 一 幅 二 值 图 像 ， 并 

假定 我 们 形成 了 一 幅 标 记 图像 玉 除了 在 该 图 像 的 边界 位 置 为 1 -7 之 外 ， 在 其 他 位 置 均 为 0， 即 
araa [l= WD y) 在 1 的 边界 上 

PADE 其 他 





(9.5-28) 
则 

680 H =| RRE] (9.5-29) 

co) 是 _ 幅 等 于 7 且 所 有 孔洞 都 被 填充 的 二 值 图 像 。 


第 9 章 形态 学 图 像 处 理 425 


让 我 们 考虑 式 (9.5-29) 中 的 各 个 分 量 ， 以 人 孔洞 的 。 
图 9.30(a) 显示 了 包含 一 个 孔洞 的 简单 图 像 1, 图 9.30 (b) 显示 了 它 的 补 集 。 注意 ,因为 了 的 补 集 将 所 有 
的 前 景 像素 (1 值 ) 设 置 为 背景 (0 值 ) 像 素 ， Bese 因此 该 操作 效果 上 建立 了 围绕 孔洞 的 一 面 元 素 
为 0 的 “ 墙 "。 因 为 7 被 用 作 一 个 AND( 与 ) 模 板 ， 这 里 我 们 所 做 的 一 切 都 是 在 该 过 程 的 迭代 期 间 保 
护 所 有 的 前 景 像素 (包括 围绕 孔洞 的 墙 ) 。 图 9.30 (c) 是 根据 式 (9.5-28) 形成 的 阵列 F, B 9.30 (d) 是 使 
用 所 有 元 素 都 为 1 的 3x3SE( 结 # 构 元 ) 膨胀 后 的 F 注意 , 标记 已 有 一 个 元 素 为 1 的 边缘 ( 除 7 为 1 的 位 
置 之 外 ) ， 故 这 些 标记 点 的 膨胀 在 边缘 处 开始 ， 并 且 向 内 处 理 。 图 9.30(e) 显示 了 使 用 7 作为 模板 对 
F 进行 测 地 膨胀 后 的 结果 。 如 刚才 指出 的 那样 ， 我 们 看 到 ， 在 这 个 结果 中 ， 对 应 于 7 的 前 景 像 素 的 所 
有 位 置 都 是 0, 并 且 对 于 孔洞 像素 同样 如 此 。 男 一 次 迭代 将 得 到 相同 的 结果 , 如 式 (9.5-29) 要 求 的 那样 ， 
求 补 后 给 出 图 9.300) PRAIA. 操作 石门 7 生成 一 幅 图 像 ， 该 图 像 中 对 应 于 7 中 孔洞 的 位 置 像 素 
值 为 1， 如 图 9.30(g) 所 示 。 
a bic a efg 
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图 9.30 在 简单 图 像 上 填充 孔洞 的 说 明 


图 9.31 显示 了 一 个 更 实际 的 例子 。 图 9.31 (b) 显示 了 图 9.31 (a) 中 文本 图 像 的 补 集 ， 图 9.31(c) 是 
FH sk (9.5-28) 产生 的 标记 图 像 Fo 除了 对 应 于 原 图 像 边 界 上 的 1 的 位 置 外 , 该 图 像 有 一 个 元 素 为 1 的 边 
界 。 最 后 ， 图 9.31 (d) 显示 了 所 有 孔洞 均 被 十 充 后 的 图 像 。 


ponents or broken connection paths. There is no poir ab 

tion past the level of detail required to identify those; ~ 
Segmentation of nontrivial images is one of the mo: cd 

processing. Segmentation accuracy determines the ev 

of computerized analysis procedures. For this reason, ¢ 

be taken to improve the probability of rugged segment. 

3 Such as industrial inspection applications, at least some 

the environment is possible at times. The experienced i 

Uma Ny designer invariably pays considerable attention to sucl 
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图 931 (a) KAW 918x2018 像素 的 文本 图 像 ; (b) 作为 模板 图 像 使 用 的 
(a) 的 补 集 ; (c) 标记 图 像 ，(d) 用 式 (9.5-29) 填充 孔洞 的 结果 


边界 清除 : 针对 后 续 形 状 分 析 的 图 像 物 体 提取 是 自动 图 像 处 理 的 基本 任务 。 删 除 接触 ( 即 连接 到 ) 
边界 的 物体 的 算法 是 一 个 很 有 用 的 工具 ,因为 ; X 它 可 以 用 于 屏 项 图 像 以 便 对 进一步 处 理 只 保留 完 
整 的 物体 , 或 者 (2) 它 可 用 作 在 视野 中 存在 部 分 物体 的 一 个 信和 号。 作为 本 节 介 绍 的 概念 的 最 后 说 明 , 我 
们 现在 提出 一 个 基于 形态 学 重建 的 边界 清除 过 程 。 在 这 一 应 用 中 ， 我 们 用 原 图 像 作为 模板 ， 并 使 用 下 
面 的 标记 图 像 : 


x,y ) 位 于 7 的 边界 上 
F(x, y= y) Gy) iF MALE (95-30) 


~ |0, 其 他 


682 


683 
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边界 清除 算法 首先 计算 形态 学 重建 R?(F) (简单 地 提取 接触 到 边界 的 物体 ) ， 然 后 计算 差 
X =I-RP(F) (9.5-31) 
以 得 到 一 幅 其 中 没有 接触 边界 的 物体 的 图 像 丈 
作为 一 个 例子 ， 再 次 考虑 文本 图 像 : 图 9.32 (a) 显示 了 使 用 所 有 元 素 均 为 1 的 3x3 的 结构 元 得 到 
HEE R (F) (注意 右 侧 接触 边界 的 物体 ) ， 图 9.32 (b) 显示 了 使 用 式 (9.5-31) 计算 得 到 的 图 像 系 如 果 
手边 的 任务 是 自动 字符 识别 ， 则 拥有 一 幅 其 中 没有 接触 边界 的 字符 的 图 像 最 有 用 ， 因 为 这 样 可 以 避免 
不 得 不 识别 部 分 字符 的 问题 (充其量 也 只 是 一 个 困难 的 任务 ) 。 





图 9.32 边界 清除 : (a) 标记 图 像 ; (b) 没有 接触 边界 的 物体 的 图 像 。 原 图 像 是 图 9.29 (a) 


9.5.10 ”二 值 图 像 形态 学 操作 小 结 


K 9.1 小 结 了 前 几 节 中 提出 的 形态 学 结果 。 图 9.33 小 结 了 迄今 为 止 讨 论 过 的 用 于 各 种 形态 
的 结构 元 的 基本 类 型 。 注 意 ， 表 9.1 第 三 列 中 的 罗马 数字 是 指 图 9.33 中 的 结构 元 








E SaS 
NE IE | RES | 
Sm B CE g 

I II 
因果 > ~ A” 8 Oe 
国 _ |x| B'i=1,2,3,4 [klip Bhi=1,2,->,8 
dxixi (旋转 90°) MT ies 45°) 

II IV 
BH Bi = 1,2,3,4 aH Bt i=5,6,7,8 
Lx] (旋转 90?) Li |.) (旋转 909) 

V 


图 9.33 用 于 一 值 形态 学 的 5 个 基本 结构 元 。 每 个 结构 元 的 原点 均 位 于 其 中 心 处 。x 项 表示 “不 考虑 ”的 值 


表 9.1 形态 学 操作 及 其 性 质 小 结 








操作 E- wee 中 的 结构 元 ) 
平移 (B), ={w|w=b+z, be B} 将 她 的 原点 平移 到 点 z 
反射 Ê, ={w|w=-b, be B} 关于 集合 B 的 原点 映射 该 集合 的 所 有 元 素 
求 补 集 A ={wlweA} 不 属于 4 的 点 的 集合 
求 差 集 A-B={w|we A, we B} 属于 4 但 不 属于 B 的 点 的 集合 
= ANB" 
膨胀 A®B={z|(B.))A#Q} “扩展 ”4 的 边界 (1) 
腐蚀 A@B={z|(B), c 4} “收缩 ”4 的 边界 O) 
683 开 操作 AcoB=(AQB)@B 平滑 轮廓 ， 切 断 狭窄 区 域 ， 并 消除 小 的 孤岛 和 人 尖 刺 (D 
=I 闭 操 作 A:B=(A®@B) eB 平滑 轮廓 ， 融 合 狭 窄 间断 和 细 长 沟 拍 ， 并 消除 小 的 孔洞 (D 





操作 
击 中 或 击 不 中 变换 


边界 提取 
孔洞 填充 


细 化 


粗 化 


裁剪 


大 小 为 1 的 测 地 膨胀 
大 小 为 n 的 测 地 膨胀 


大 小 为 1 的 测 地 腐蚀 
大 小 为 n 的 测 地 腐蚀 


膨胀 形态 学 重建 
腐蚀 形态 学 重建 
重建 开 操作 
重建 闭 操作 
孔洞 填充 


边界 清除 
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A@B=(A€B,)(\(A° © B,) 
=(A@B,)-(A®@B,) 

B(A) = A-(A OB) 

X, =(X BBN A; 
k=1, 2, 3, ++ 

和 =(X OB)N A; 
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( 续 表 ) 

说 了 明 
(罗马 数字 是 指 图 9.33 中 的 结构 元 ) 
点 (坐标 ) 的 集合 ， 在 这 样 的 点 处 ， 同 时 ，B 在 4 中 可 找到 一 
个 匹配 ( 击 中 )， 甩 在 4° 中 可 找到 一 个 匹配 
在 集合 4 的 边界 上 的 点 的 集合 (1) 
填充 4 中 的 孔洞 ; 为 是 每 个 孔洞 处 元 素 为 1 而 其 他 位 置 元 素 
为 0 的 阵列 (四 
寻找 4 中 的 连通 分 量 ; 为 是 每 个 连通 分 量 中 元 素 为 1 而 其 他 
位 置 元 素 为 0 的 阵列 (1) 
寻找 集合 4 thse CA), 其 中 conv 表示 Xi = Xia (ID 意义 
上 的 收敛 ， 


细 化 集合 4。 前 两 个 公式 给 出 细 化 的 基本 定义 。 后 两 个 公式 
表示 使 用 一 个 结构 元 序列 的 细 化 实际 中 通常 使 用 这 种 方法 
(IV) 


(C“((4®B8')®B)-.) B") 


{B}={B', B°, B’, -- , B"} 


AOQB=AU(4@B) 
AQO{B}= 


((---(A© B') OB’ ---)O B") 


K 
5(4)=5,(4) 
k=0 


Si(A)={(AOKB) 
-{(A@kB)> B)} 
4 的 重建 : 


K 
A=|_J(S.(4)® kB) 
k=0 


X, = A@{B} 
8 
X, =U%@8") 
k=l 
X,=(X,®H)NA 
X,=X,UX; 


DË (F)=(F ® B)NG 


Dg? (F) = DP | DEF) |; 
Di) (F) =F 

EQ (F)=(F ©B)UG 

EQ) (F)= EQ Eg? (F) | 


EOF) =F 

RG (F) = DẸ (F) 
RG(F)= EQ) (F) 

Of (F) = RFI(F OnB) 
Ch? (F) = Re [(F © nB)) 
H=[R2(F)] 


X =1-R?(F) 





粗 化 集合 4( 见 前 面 关于 结构 元 序列 的 说 明 ) 。 使 用 IV, 但 把 
0 和 1 颠倒 


寻找 集合 4 的 骨架 5(4)。 最 后 一 个 公式 指出 4 可 以 由 其 骨架 
TÆ S,(A) 重建 。 在 所 有 3 MARE, KERS 4 被 腐蚀 为 
空 集 时 的 迭代 次 数 。 符 号 (4BkB) 表示 B 对 A 连续 腐蚀 的 第 
k WERO) 


X BURG 4 后 的 结果 。 必 须 指定 使 用 第 一 个 公式 来 得 到 
如 的 次 数 。 结 构 元 V 用 于 前 两 个 公式 。 在 第 三 个 公式 中 , H 
表示 结构 元 I 


FAI G 分 别称 为 标记 图 像 和 模板 图 像 


大 满足 DY (F) = DEY (FY 
丰满 足 ED(F)= ESP) 

(F OnB) KIR B Xi F H n VIR 

(F © nB) 表示 B 对 下 的 n 次 膨胀 

万 等 于 输入 图 像 岂 但 具有 所 有 被 填充 的 孔洞 。 标记 图 像 下 的 
定义 见 式 (9.5-28) 
也 等 于 输入 图 像 1, 但 带 有 所 有 被 删除 接触 (连接 到 ) 边 界 的 物 
体 。 标 记 图 像 玉 的 定义 见 式 (9.5-30) 





428 数字 图 像 处理 ( 第 三 版 ) 


9.6” 灰 度 级 形态 学 


在 这 一 节 中 ,我 们 将 把 膨胀 、 腐 蚀 、 开 操作 和 闭 操作 的 基本 操作 扩展 到 灰 度 级 图 像 。 然 后 ,我们 
将 使 用 这 些 操作 来 探讨 几 个 基本 的 灰 度 级 形态 学 算法 。 

通过 下 面 的 讨论 , 我 们 将 处 理 形 如 (x,y) 和 b(x,y) 的 数字 函数 ， 其 中 f(x, 是 一 幅 灰 度 级 图 像 ， 而 
b(x, yp) 是 一 个 结构 元 。 假 设 这 些 函 数 是 2.4.2 节 中 介绍 过 的 离散 函数 。 也 就 是 说 ， 如 果 Z 表示 实 整数 集 
合 , 则 坐标 (Gx, 是 来 自 笛 卡 儿 积 己 的 整数 , 且 f 和 4 是 对 每 个 (x, yy) 坐 标 对 赋 以 灰 度 值 (来 自 实数 集合 R 
的 一 个 实数 ) 的 函数 。 如 果 灰 度 级 也 是 整数 ， 则 用 Z 代替 Ro 

灰 度 级 形态 学 中 的 结构 元 所 执行 的 基本 功能 与 二 值 形态 学 中 对 应 的 功能 相同 : 它们 作为 一 个 “ 探 
测 器 ”以 明确 的 特性 检验 一 幅 给 定 的 图 像 。 灰 度 级 形态 学 中 的 结构 元 分 为 两 类 : 非 平 坦 的 和 平坦 的 结 
构 元 。 图 9.34 显示 了 每 类 的 一 个 例子 。 图 9.34(a) 以 图 像 形式 显示 了 一 个 半球 状 的 灰 度 级 结构 元 ， 
图 9.34 (c) 是 一 个 通过 其 中 心 的 水 平 灰 度 剖 面 。 图 9.34(b) 显示 了 一 个 圆 盘 形 的 平坦 结构 元 ,图 9.34(d) 
是 其 对 应 的 灰 度 剖面 (该 剖面 的 形状 解释 了 “平坦 ”一 词 的 由 来 ) 。 为 清楚 起 见 ， 图 9.34 中 的 元 素 以 连 
续 量 显示 ; 它们 的 计算 机 实现 是 以 数字 近似 为 基础 的 ( 见 图 9.2 中 最 右 侧 的 圆 盘 形 SE“ 结 构 元 ”) 。 由 
于 本 节 稍 后 讨论 的 一 些 困难 ,实际 中 灰 度 级 结构 元 并 不 常用 。 最 后 ,我 们 要 提 及 的 是 ， 如 在 二 值 情 况 
那样 ， 必 须 清楚 地 确定 结构 元 的 原点 。 除 非 男 外 提 及 ， 本 节 中 的 所 有 例子 都 以 高 度 为 1、 对 称 的 、 平 
坦 的 结构 元 为 基础 ， 其 原点 位 于 中 心 处 。 灰 度 级 形态 学 中 结构 元 的 反射 的 定义 ， 如 9.1 节 中 的 定义 一 
样 ， 且 在 下 面 的 讨论 中 我 们 将 它 表示 为 b(x,y) = b(—x,-y) 。 


am 





ab 
ed 
不 平坦 结构 元 平坦 结构 元 AEA 灰 度 剖面 
图 9.34 非 平坦 和 平坦 结构 元 ， 以 及 对 应 的 通过 其 中 心 的 水 平 灰 度 剖面 。 本 节 中 的 所 有 例子 均 基 于 平坦 结构 元 
9.6.1 ”腐蚀 和 膨胀 


b 的 原点 位 于 (x, y) 处 时 ， 用 一 个 平坦 的 结构 元 b 在 (x, yy) 处 对 图 像 了 的 腐蚀 定义 为 图 像 f 中 与 5 
重合 区 域 的 最 小 值 。 以 公式 的 形式 ， 结 构 元 素 b 对 一 幅 图 像 f 在 位 置 (x, y) 处 的 腐蚀 由 下 式 给 出 : 


DOENE = min df (et yt , (9.6-1) 


其 中 ， 用 与 3.4.2 节 讨 论 的 相关 过 程 类 似 的 方式 ,x 和 yy 通过 所 有 要 求 的 值 增 加 ， 以 便 4& 的 原点 能 访问 
了 中 的 每 个 像素 。 也 就 是 说 ， 为 寻求 b 对 /的 腐蚀 ,我们 把 结构 元 的 原点 放 在 图 像 的 每 个 像素 的 位 置 。 
在 任何 位 置 的 腐蚀 由 从 包含 在 与 b 重合 区 域 中 的 /的 所 有 值 中 选取 的 最 小 值 决定 。 例 如 ， 如 果 b 是 大 
小 为 3x3 的 方形 结构 元 , 则 获得 一 点 处 的 腐蚀 要 求 寻 找 包 含 在 由 4b 定 义 的 3x3 区 域 中 的 f 的 9 个 值 中 ， 
其 原点 所 在 的 那个 点 的 最 小 值 。 
类 似 地 ， 当 6 的 原点 位 于 位 置 (x, y) 处 时 ， 平 坦 结 构 元 b 在 任何 位 置 (x, y) 处 对 图 像 f 的 膨胀 ， 定 义 
B 为 图 像 f 中 与 5 重合 区 域 的 最 大 值 ， 即 
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[f @b\(x, y)= max {f(x-s, y-t)} (9.6-2) 


其 中 ， 我 们 用 到 了 早 些 时 候 说 明 过 的 = b(—x,—y) 这 一 事实 。 对 该 式 的 解释 与 前 一 段 中 的 解释 相同 ， 
但 使 用 的 是 最 大 而 非 最 小 操作 , 并 且 要 记 住 结构 元 关于 其 原点 反射 ,我 们 用 (- -0 考虑 函数 的 自 变量 。 
这 类 似 于 空间 卷 积 ， 就 像 3.4.2 节 中 解释 的 那样 。 


例 9.9 灰 度 级 腐蚀 和 膨胀 的 说 明 。 ' 

因为 使 用 一 个 平坦 SE (结构 元 ) 的 灰 度 级 腐蚀 计算 图 像 /中 与 b 重合 的 (x,y) 的 每 个 邻 域 的 最 小 灰 度 值 ， 
因此 通常 我 们 希望 被 腐蚀 的 灰 度 级 图 像 比 原始 图 像 暗 ， 亮 特征 的 尺寸 (关于 SE 的 尺寸 ) 将 会 碱 小 ， 而 暗 
特征 的 尺寸 将 会 增 大 ,图 9.35 (b) 显示 了 使 用 一 个 单位 高 度 和 半径 为 2 像素 的 圆 盘 形 结构 元 素 对 图 935 (a) 
的 腐蚀 。 刚 才 讨 论 的 效果 在 腐蚀 过 的 图 像 中 清晰 可 见 。 例 如 ,请 注意 小 亮点 亮度 的 降低 程度 ， 图 9.35 (b) 
中 几乎 已 看 不 到 这 些小 亮点 ， 同 时 暗色 特征 则 变 浓 。 腐 蚀 过 的 图 像 中 的 一 般 背 景 比 原 图 像 的 背景 要 稍 暗 一 
些 。 类 似 地 ， 图 9.35 (e) 显示 了 使 用 相同 SE 膨胀 后 的 结果 。 其 效果 与 用 腐蚀 得 到 的 效果 相反 ， 即 亮 特征 变 
浓 ， 而 暗 特征 变 淡 。 请 特别 注意 图 9.35 (a) 中 左 侧 、 中 间 、 右 侧 和 底部 的 较 细 黑 色 连 线 在 图 9.35 (c) 中 几乎 
已 看 不 见 。 黑 点 的 尺寸 已 被 减 小 ， 但 但 与 图 9.35 (b) 中 被 腐蚀 的 小 白 点 完全 不 同 ， 在 膨胀 后 的 图 像 中 ,小 白 点 
却 清晰 可 见 。 其 原因 是 与 结构 元 的 尺寸 相 比 ， 黑 点 的 尺寸 原来 就 比 白 点 大 。 最 后 ， TEENIE ENE 
的 背景 比 图 9.35 (a) 中 的 背景 稍 亮 


非 平 坦 结构 元 具有 随 定 义 域 变 化 的 灰 度 级 。 非 平坦 结构 元 by 对 图 像 7 的 腐蚀 定义 如 下 : 
[fby](x, y) = .min {f(x+s, y+t)—by(s, t)} (9.6-3) 
这 里 , 我 们 实际 上 是 从 f 中 减 去 b、 的 值 来 确定 任意 点 处 的 腐蚀 。 与 式 (9.6-1) 不 同 , 这 意味 着 使 用 非 平 坦 


结构 元 的 腐蚀 通常 不 受 f 值 的 限制 ， 而 这 在 解释 结果 时 会 存在 问题 。 因 为 这 一 原因 ， 实 际 中 很 少 使 用 灰 
度 级 结构 元 ; 另外 ， 与 式 (9.6-1) 相 比 ， 为 by 选取 有 意义 的 元 素 和 增加 的 计算 负担 也 是 一 个 问题 。 





图 9.35 (a) 大 小 为 448x425 像素 的 灰 度 级 X 射线 图 像 ; (b) 使 用 半径 为 2 个 像素 的 圆 盘 形 结构 
元 对 图 像 的 腐蚀 结果 ; (c) 用 相同 结构 元 对 图 像 的 膨胀 结果 ( 原 图 像 由 Lixi 公司 提供 ) 


采用 类 似 的 方式 ， 使 用 非 平坦 结构 元 的 膨胀 定义 如 下 : 
[S ®by I(x, ») = max {f(x—s, y-t) +by(s, 0)} (9.6-4) 
前 一 段 给 出 的 说 明 同样 适用 于 使 用 非 平坦 结构 元 的 膨胀 。 当 b, 的 所 有 元 素 都 是 常数 时 ( 即 结构 元 是 平 
坦 的 )， 式 (9.6-3) Ast (9.6-4) 就 分 别 简 化 为 式 (9.6-1) 和 式 (9.6-2) ， 其 中 一 个 标量 常数 等 于 该 结构 元 的 
幅度 。 
如 二 值 情 况 那样 ， 腐 蚀 和 膨胀 是 关于 函数 的 补 集 和 反射 对 偶 的 ， 即 
(feb) (x, y)=(f° Bb)(x, y) 
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step, f° = 一 f(x,y) Hb =4b(-x,-y)。 相 同 的 表达 式 对 非 平坦 结构 元 也 有 效 。 为 清楚 起 见 ， 在 下 面 的 
讨论 中 ,我们 将 忽略 所 有 函数 的 参量 以 简化 表达 式 ， 在 这 种 情况 下 ， 前 一 公式 可 写 为 
(feb) =(/° D) (9.6-5) 
类 似 地 ， 
(Fb) =(f°e b) (9.6-6) 
自身 的 腐蚀 和 膨胀 在 灰 度 级 图 像 处理 中 并 不 是 特别 有 用 。 像 对 应 的 二 值 情形 那样 ， 当 这 些 操 作 组 合 
用 来 推导 高 级 算法 时 ， 会 变 得 强 有 力 ， 如 下 节 所 示 的 材料 那样 。 
9.6.2” 开 操作 和 闭 操作 
灰 度 级 图 像 的 开 操作 和 闭 操作 的 表达 式 ， 与 二 值 图 像 的 对 应 操作 
具有 相同 的 形式 。 结构 元 b 对 图 像 的 开 操 作 表 示 为 feb5， 即 
fob=(f©b)®b (9.6-7) 


像 之 前 那样 ， 开 操作 先 只 用 b 对 了 做 腐蚀 ， BE b XTR. 类似 地 ，b 对 了 的 闭 操 作 表示 
fb, BI 





fb=(f ®b)Əb (9.6-8) 
灰 度 级 图 像 的 开 操作 和 闭 操 作 关于 函数 的 补 集 和 结构 元 的 反射 是 对 偶 的 : 
(feb) = f° 0b (9.6-9) 
All 
(feb) = fib (9.6-10) 


因为 1 = -Go 了 ， 所 以 式 (9.6-9) 也 可 以 写 为 -(fb)=(-/。5) ， 式 (9.6-10) 的 情形 类 似 。 
re 图 像 的 开 操作 和 闭 操作 具有 简单 的 几何 解释 。 
加 ”假设 我 们 将 一 个 图 像 函数 f(x, 轧 视 为 一 个 三 维 表 
AC a. So T 也 就 是 说 , 它 的 灰 度 值 可 解释 为 ao 平面 上 的 高 
图 Ef, WA 2.18(a) 所 示 。 然 后 , 五 对 7 的 开 操 作 可 
A e 从 几何 角度 解释 为 , 从 /的 下 表面 向 上 推动 结构 元 。 
TE b 的 每 个 原点 位 置 ， 开 操作 是 当 从 /的 下 表面 向 


上 推动 结构 元 时 ，2 的 任何 部 分 所 达到 的 最 高 值 。 
这 样 ， 完 全 开 操作 就 是 由 的 原点 访问 了 的 每 个 坐 
标 (x, y) 所 得 到 的 所 有 值 的 集合 。 

图 9.36 以 一 维 的 形式 说 明了 这 个 概念 。 假定 
图 9.36(a) 中 的 曲线 是 沿 图 像 中 的 一 行 的 灰 度 痢 
面 。 图 9.36 (b) 显示 了 沿 曲线 底部 向 上 推 到 不 同位 
置 的 一 个 平坦 结构 元 。 图 9.36(c) 的 实 线 是 完全 开 操 


[= ea 作 。 因 为 结构 元 太 大 而 不 能 完全 拟 合 曲线 上 部 峰值 
图 9.36 ”一 维 情形 下 的 开 操作 和 闭 操作 : (a) 原始 的 内 侧 , 故 峰 值 的 顶 


的 一 维 信号 ; (b) 从 信号 底部 向 上 推动 的 部 被 开 操 作 前 切 掉 
平坦 结构 元 素 ; (c) 开 操作 ; (d) 沿 信号 项 T, 前 切 的 量 与 结构 | 明 。 在 三 维 情形 下 ,， 圆 可 用 球体 来 蔡 
部 向 下 推动 的 平坦 结构 元 素 ，(e) 闭 操作 。 ”元 能 够 到 达 峰 值 的 | 代 ， 得 到 的 过 程 称 为 六 于 和 法 。 


Paors 





有 时 , 开 操作 和 闭 操作 可 由 在 一 条 
曲线 的 下 侧 和 上 侧 滚 动 一 个 圆 来 说 
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距离 成 比例 。 通 常 ， 开 操作 用 于 去 除 较 小 的 明亮 细节 ， 而 保持 整体 灰 度 级 和 较 大 的 明亮 特征 相对 不 变 。 

图 9.36(d) 是 闭 操作 的 图 形 说 明 。 很 明显 ， 结 构 元 从 曲线 的 顶部 向 下 推动 ， 同 时 平移 到 所 有 位 置 。 
如 图 9.36(e) 所 示 ， 当 结构 元 从 曲线 的 上 侧 滑动 时 ， 通 过 寻找 结构 元 的 任何 部 分 所 能 到 达 的 最 低 点 ， 即 
可 构建 闭 操作 。 

灰 度 级 开 操作 满足 如 下 性 质 : 

(a) foblf o 

(b) HAA. MAb) Aeb) 。 

(c) (fcb)ob=(f 0b). 

符号 eJr 用 来 表示 e 的 域 是 -的 域 的 一 个 子 集 ， 且 对 于 e 的 域 中 的 任何 (Gx, y), A ex, y) <r, y)。 

类 似 地 ， 闭 操作 满足 如 下 性 质 : 

(a) ffebo 

(b) Hf, Wd) fd) o 

(c) (feb)b =(feb) o 

这 些 性 质 的 用 途 类 似 于 三 值 图 像 中 的 对 应 性 质 。 





图 9.37 (a) 一 幅 大 小 为 448x425 像素 的 灰 度 级 X 射线 图 像 ; (b) 使 用 半径 为 3 个 像素 的 圆 盘 
形 结构 元 得 到 的 开 操作 结果 ; (c) 使 用 半径 为 5 个 像素 的 结构 元 得 到 的 闭 操作 结果 


许多 形态 学 技术 是 以 迄今 为 止 介绍 的 灰 度 级 形态 学 概念 为 基础 的 。 下 面 的 讨论 中 我 们 将 说 明 这 些 
算法 。 
形态 学 平滑 
因为 开 操 作 抑 制 比 结构 元 小 的 亮 细 节 ， 而 闭 操作 抑制 暗 细节 ， 所 以 它们 常常 以 形态 滤波 的 形 
式 结合 起 来 平滑 图 像 和 去 除 噪 声 。 考虑 图 9.38(a) , 它 显 示 了 一 幅 使 用 X 射线 波段 拍摄 的 天 鹅 星座 好 
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环 超新星 图 像 ( 关 于 该 医 | 像 的 细节 请 参阅 图 1.7) 。 为 当前 讨论 的 目的 ， 假 设 中心 的 亮 区 域 是 我 们 感 兴 


趣 的 目标 ， 而 较 小 的 分 量 是 噪声 。 我 们 的 目的 是 去 除 噪声 。 图 9.38 (b) 显示 了 用 一 个 半径 为 2 的 平坦 
圆 盘 (结构 元 ) 对 原始 图 像 进行 开 操作 ， 再 用 相同 尺寸 的 SE (结构 元 ) 进行 闭 操作 的 结果 。 图 9.38 (c) 和 


(d) 分 别 显示 了 使 用 半径 为 3 和 5 的 结构 元 进行 相同 操作 得 到 的 结果 。 如 期 望 的 那样 , 该 图 像 序列 显 示 
了 消除 作为 结构 元 尺寸 的 函数 的 小 分 量 的 改进 。 在 最 后 的 结果 中 ， 我 们 看 到 ， 感 兴趣 的 目标 已 被 提取 
出 来 。 图 像 底部 的 噪声 分 量 未 被 完全 去 除 ， 原 因 在 于 它们 的 密度 

图 9.38 的 结果 是 以 对 原始 图 像 进行 开 操 作 ， 然 后 再 进行 闭 操作 为 基础 的 。 有 了 时 使 用 的 一 个 过 程 是 
执行 交替 顺序 滤波 ,在 该 过 程 中 ,对 原始 图 像 以 开 操 作 - 闭 操作 顺序 开始 ,但 后 续 步 又 对 前 一 步骤 的 结 
果 再 执行 开 操作 和 闭 操作 。 这 种 类 型 的 滤波 在 自动 图 像 分 析 中 很 有 用 ， 滤 波 过 程 中 每 一 步 的 结果 都 针 
对 一 个 指定 的 度量 进行 比较 。 通 常 ， 对 于 相同 大 小 的 结构 元 ， 与 图 9.38 中 说 明 的 方法 相 比 ， 这 种 方法 
会 产生 更 为 模糊 的 结果 


abcd 





图 9.38 (a) FH NASA 的 哈 勃 望远镜 在 X 射 线 波段 拍摄 的 天 鹅 星 座 环 超新星 
的 566x566 图 像 ;(b)~(d) 分 别 使 用 半径 为 1, 3 和 5 的 圆 盘 形 结构 
元 对 原 图 像 执 行 开 操作 和 闭 操作 顺序 的 结果 ( 原 图 像 由 NASA 提供 ) 


形态 学 梯度 
膨胀 和 腐蚀 可 与 图 像 相 减 结合 起 来 得 到 一 幅 图 像 的 形态 学 梯度 ， 形 态 学 梯度 由 g EM: 


g=(f 9b)-(feb) (9.6-11) 


ARIA PK, CUA CE]. DAUR he PES el x AFR Wad LK MANS 
影响 (只 要 SE 相对 较 小 ) ， 因 此 相 减 操作 趋 于 消除 同 质 区 域 。 最 终结 果 是 是 边缘 被 增强 而 同 质 区 域 的 
贡献 则 被 抑制 的 图 像 ， 因 此 产生 了 “类 似 于 微分 ” (梯度 ) 的 效果 。 

图 9.39 显示 了 一 个 例子 。 图 9.39(a) 是 一 幅 头 部 的 CT 扫描 图 像 ， 接 下 来 的 两 幅 图 像 是 使 用 所 有 元 
素 都 为 1 的 3x3 结构 元 对 该 图 像 进行 开 操作 和 闭 操 作 的 结果 。 注 意 刚刚 提 到 的 粗 化 和 收缩 。 图 9.39 (d) 
是 使 用 式 (9.6-11) 得 到 的 形态 学 梯度 ,其 中 清楚 地 描绘 了 区 域 间 的 边界 ,这 与 二 维 微分 图 像 的 预期 
相同 。 


å boud 





FA 9.39 (a) 512x512 的 头 部 CT 扫描 图 像 ; (b) 膨胀 的 结果 ; (c) 腐蚀 的 结果 ; (EARE, 
计算 图 (b) 和 图 (c) 间 的 差 ( 原 图 像 由 Vanderbilt 大 学 的 David R. Pickens 博士 提供 ) 


顶 帆 变换 和 底 帆 变换 


图 像 相 减 与 开 操作 和 闭 操 作 相 结合 ， 可 产生 所 谓 的 Top-hat( 顶 帽 ) 变 换 和 bottom-hat OEI) 变换 。 
灰 度 级 图 像 7 的 顶 帽 变换 定义 为 了 减 去 其 开 操作 : 


LaS) = f —Cf eb) (9.6-12) 
类 似 地 ，f 的 底 帆 变换 定义 为 1 的 闭 操作 减 去 /: 
Bia(f)=(f°b)-f (9.6-13) 


这 些 变 换 的 主要 应 用 之 一 是 ， 用 一 个 结构 元 通过 开 操 作 或 闭 操作 从 一 幅 图 像 中 删除 物体 ， 而 不 是 拟 合 
被 删除 的 物体 。 然 后 ， 差 操作 得 到 一 幅 仅 保留 已 删除 分 量 的 图 像 。 顶 帽 变换 用 于 暗 背 景 上 的 亮 物体 ， 
而 底 帽 变换 则 用 于 相反 的 情况 。 由 于 这 一 原因 ， 当 我 们 谈 到 这 两 个 变换 时 ， 常 常 分 别称 为 白 顶 帽 变 换 
和 黑 底 帆 变换 。 

顶 帽 变换 的 一 个 重要 用 途 是 校正 不 均匀 光照 的 影响 。 如 我 们 在 下 一 章 中 看 到 的 那样 ， 合 适 (均匀 ) 
的 光照 在 从 背景 中 提取 目标 的 处 理 中 扮演 核心 的 角色 。 称 为 分 割 的 这 一 处 理 是 自动 图 像 分 析 中 执行 的 
第 一 步 。 一 种 常用 的 分 割 | 方法 是 对 输入 图 像 进行 闵 值 处 理 。 

为 便于 说 明 , 考虑 图 9.40(a) , 它 显示 了 一 幅 大 小 为 600x600 的 米粒 图 像 。 该 图 像 是 在 非 均匀 光照 
下 得 到 的 ， 如 图 像 底部 及 最 右 侧 的 暗色 区 域 就 是 明证 。 图 9.40 (b) 显示 了 对 该 图 像 使 用 10.3.3 节 讨 论 的 
Otsu 最 佳 闵 值 处 理 方 法 得 到 的 结果 。 非 均匀 光照 的 最 终结 果 导 致 了 暗 区 域 的 分 割 错误 (一 些 米粒 未 从 
背景 中 提取 出 来 ) ， 且 在 图 像 的 左上 角 ， 背 景 部 分 被 错误 地 分 类 了 。 图 9.40(c) 显示 了 对 该 图 像 使 用 一 
个 半径 为 40 的 圆 盘 形 结构 元 进行 开 操作 的 结果 。 这 个 结构 元 大 到 足以 不 会 拟 合 任何 物体 ,如 结果 那样 ， 
这 些 物体 被 消除 了 ， 仅 留 下 一 个 近似 的 背景 。 阴 影 模式 在 该 图 像 中 很 清楚 。 通 过 从 原 图 像 中 减 去 该 图 
像 ( 即 执行 项 帽 变换 ), 背景 应 会 变 得 更 均匀 。 事实 的 确 如 此 , 如 图 9.40(d) 所 示 。 背景 并 不 是 非常 均匀 ， 
但 亮 和 暗 之 间 不 再 存在 极端 的 差别 ， 这 就 是 以 得 到 正确 的 分 割 结果 ， 其 中 所 有 的 米粒 均 被 检测 出 来 ， 
如 图 9.40 (e) 所 示 。 以 前 ， 





图 9.40 使 用 顶 帽 变换 校正 阴影 : (a) 大 小 为 600x600 的 原 图 像 ;(b) 阅 值 处 理 后 
的 图 像 ;(c) 用 半径 为 40 的 圆 盘 形 结构 元 进行 开 操作 的 图 像 ，(d) 项 帽 变 
换 的 图 像 ( 图 像 减 去 其 开 操 作 ) ; (e) 顶 帽 变换 的 图 像 经 阔 值 处 理 的 结果 
粒度 测定 
在 图 像 处 理 方面 ， 粒 度 测 定 属于 判断 图 像 中 颗粒 的 尺寸 分 布 的 领域 。 实 践 中 ， 颗 粒 很 少 能 完 
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美 地 分 离 ， 这 就 使 得 用 识别 单个 颗粒 来 计 数 很 困难 。 形 态 学 可 间接 用 于 估计 颗粒 的 尺寸 分 布 ， 而 不 需 


要 识别 并 测量 图 像 中 的 每 个 颗粒 。 

这 种 方法 原理 上 非常 简单 。 对 于 比 背 景 亮 且 具有 规则 形状 的 颗粒 ， 该 方法 由 使 用 逐渐 增 大 的 结构 
元 对 图 像 执行 开 操作 组 成 。 基 本 概念 是 ， 某 个 特殊 尺寸 的 开 操作 应 会 对 包含 类 似 尺 寸 的 颗粒 的 输入 图 
像 的 区 域 产生 最 大 的 效果 。 对 于 每 次 开 操作 ， 计 算 该 开 操作 中 像素 值 的 和 。 该 和 有 时 称 为 表面 区 域 
它 会 随 着 结构 元 的 增 大 而 减 小 ， 如 我 们 早 些 时 候 注 释 的 那样 ， 因 为 开 操作 会 降低 亮 特征 的 灰 度 。 该 过 
程 会 得 到 一 个 这 样 的 数字 的 一 维 阵 列 ， 阵 列 中 的 每 个 元 素 等 于 对 应 于 阵列 中 该 位 置 的 结构 元 素 的 大 小 
的 开 操作 中 的 像素 之 和 。 为 了 强调 连续 开 操作 间 的 变化 ,我 们 计算 一 维 阵 列 的 相 邻 元 素 的 差 。 为 了 形 
象 化 该 结果 ， 我 们 画 出 了 该 差 的 图 形 。 曲 线 中 的 峰值 表明 了 图 像 中 颗粒 的 主要 大 小 分 布 。 

作为 一 个 例子 ,考虑 图 9.41 (a) ， 它 是 两 种 不 同 大 小 的 木 杀 图 像 。 对 木 钉 中 的 木 颗粒 可 能 需要 引入 
不 同 的 开 操作 ,， 因 此, 平滑 是 一 种 合理 的 预 处 理 步骤 。 图 9.41 (b) 显示 了 使 用 早期 讨论 过 的 形态 学 滤波 
器 平滑 后 的 图 像 ， 该 滤波 器 用 半径 为 5 的 圆 盘 形 结构 元 。 图 9.41 (c) 到 O 显示 了 使 用 半径 为 10, 20, 25 
和 30 的 圆 盘 形 结构 元 对 图 像 进行 开 操作 的 例子 。 注 意 ， 在 图 9.41 4d) 中 ， 由 于 较 小 的 木 钉 ， 灰 度 的 贡献 
几乎 已 被 消除 。 图 941 (e), 大木 钉 的 贡献 已 被 显著 地 降低 ,图 9.41(b) 更 厉害 [观察 图 9.41(e) ,靠近 图 
像 右 上 方 的 大 木 钉 比 其 暗 得 多 ， 因 为 它 的 尺寸 较 小 。 如 果 我 们 试图 检测 有 缺陷 的 木 打 ， 那 么 这 将 是 有 
用 的 信息 J 





图 9.41 (a) 大 小 为 531x675 的 木 钉 图 像 ，(b) 平 滑 后 的 图 像 ;(c)~(D 分 别 
用 半径 为 10, 20, 25 和 30 像素 的 圆 盘 形 结构 元 对 图 像 进 行 开 操作 
后 的 结果 ( 原 图 像 由 MathWorks 公司 的 Steve Eddins 博士 提供 ) 














图 9.42 显示 了 该 差 值 阵列 的 曲线 。 如 前 边 提 到 的 15X10" | 
那样 ， 我 们 期 望 半径 附近 的 差 值 较 大 (曲线 中 的 峰 
值 ) , 在 该 处 结构 元 足够 大 ,以 包围 近似 相同 直径 的 一 ? 
组 颗粒 。 图 9.42 中 的 结果 有 两 个 明显 的 峰值 , 这 清楚 地 Sas 
表明 图 像 中 存在 两 种 主要 的 物体 尺寸 D 
纹理 分 割 R 
图 943 (a) aT RCT RI TIRE ““ 
噪声 图 像 。 该 图 像 有 两 个 纹理 区 域 : 右边 大 斑点 组 成 的 fe 
区 域 和 左边 小 斑点 组 成 的 区 域 .目的 是 以 纹理 内 容 为 基 EN ea 
础 找到 两 个 区 域 的 边界 (我 们 将 在 11.3.3 节 讨 论 纹理 ) 。 图 942 ct A ERES 
如 早期 解释 的 那样 ,将 一 幅 图 像 分 为 区 域 的 处 理 称 为 分 nd nd ni 


z, SEES 10 音 的 主题 。 像 中 存在 两 个 主要 的 颗粒 尺寸 
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感 兴趣 的 物体 比 背 景 暗 ， 并 且 我 们 知道 ， 如 果 使 用 一 个 比 小 斑点 大 的 结构 元 对 图 像 做 闭 操作 ， 这 
些 斑点 将 被 删除 。 在 图 9.43 (b) 中 ， 使 用 半径 为 30 像素 的 圆 盘 形 结构 元 对 输入 图 像 做 闭 操作 的 结果 ， 
表明 情况 的 确 如 此 (斑点 的 半径 近似 为 25 像素 ) 。 因 此 , 我 们 得 到 了 一 幅 亮 背景 上 带 有 暗色 大 斑点 的 图 
像 。 如 果 使 用 尺寸 大 于 这 些 斑 点 间 的 间隔 的 结构 元 对 该 图 像 做 开 操作 ， 则 最 终结 果 应 该 是 这 样 一 幅 图 
像 ， 在 该 图 像 中 ， 斑 点 间 的 亮 间隔 已 被 删除 ， 留 下 了 暗色 斑点 ， 并 且 这 些 斑 点 之 间 的 暗 间隔 现在 已 变 
得 相同 。 图 9.43 (c) 显示 了 使 用 半径 为 60 的 圆 盘 形 结构 元 得 到 的 结果 。 


abed 2 @2@ “ee 











图 9.43 纹理 分 割 : (a) 由 两 种 斑点 组 成 的 大 小 为 600x600 的 图 像 ;(b) 对 图 (a) 执行 财 操作 后 删除 
TASER MEME; (c) 对 图 tb) 执行 开 操作 后 删除 了 大 斑点 间 的 亮 间隔 的 图 像 ; (d) 将 图 
(c) 中 两 个 区 域 间 的 边界 硬 加 到 原 图 像 上 后 的 结果 。 边 界 是 使 用 形态 学 梯度 操作 得 到 的 


使 用 一 个 元 素 全 为 1 且 大 小 为 3x3 的 结构 元 对 该 图 像 执行 形态 学 梯度 操作 , 将 给 出 这 两 个 区 域 间 的 
边界 。 图 9.43(d) 显示 了 将 形态 学 梯度 操作 结果 释 加 到 原 图 像 后 所 得 到 的 边界 。 该 边界 右 侧 的 所 有 像素 表 
示 属于 由 大 斑点 表征 的 纹理 区 域 , 而 该 边界 左 侧 的 所 有 像素 属于 由 小 斑点 表征 的 纹理 区 域 。 读者 将 发 现 ， 
若 使 用 图 9.36 中 对 开 操 作 和 闭 操作 的 图 形 模拟 ， 那 么 我 们 可 更 直观 地 理解 这 一 例子 。 


9.6.4” 灰 度 级 形态 学 重建 


灰 度 级 形态 学 重建 基本 上 按照 与 9.5.9 节 针 对 二 值 图 像 所 介绍 的 相 
同方 法 来 定义 。 令 f 和 gg 分 别 代表 标记 图 像 和 模板 图 像 。 我 们 假设 和 很 容易 理解 这 些 表达 式 是 (e ») 18 
g 是 大 小 相同 的 灰 度 级 图 像 ， 且 f < gs f 关 于 g 的 大 小 为 1 的 测 地 脱 | 要 数 , 为 条 化 表示 ,我 们 省 略 ] Gy) « 
胀 定 义 为 





DY (f)=(f EBAR (9.6-14) 
式 中 ， 和 ^ 代表 点 方式 的 最 小 算 子 。 该 式 指出 ， 大 小 为 1 的 测 地 膨胀 是 先 计算 b 对 了 的 膨胀 ， 然 后 选择 
在 每 个 (x, 点 处 该 结果 和 g 间 的 最 小 者 。 如 果 b 是 一 个 平坦 结构 元 ， 则 膨胀 由 式 (9.6-2) 给 出 ， 否 则 脱 
胀 由 式 (9.6-4) 给 出 。f 关 于 g 的 大 小 为 n 的 测 地 膨胀 定义 为 
D(f)=DP [DEA ; (9.6-15) 
IFA DO (f) =f o 
JEW, PEF g 的 大 小 为 1 的 测 地 腐蚀 定义 为 


E? (fy =(feb)vg (9.6-16) 
SUP, v 表示 点 方式 的 最 大 算 子 。f 关 于 g 的 大 小 为 n 的 测 地 腐蚀 定义 为 
Bre | 7) | (9.6-17) 


697 
并 有 BE (f/)=f。 - 
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灰 度 级 标记 图 像 7 对 灰 度 级 模板 图 像 g 的 膨胀 形态 学 重建 , 定义 为 | ”二 节 中 表达 式 间 的 对 偶 关 系列 表 





SRF g 的 测 地 膨胀 反复 迭代 ， 直 至 达到 稳定 ; B 见习 题 933。 
Re (f) = Def) (9.6-18) 

EE DP (f) = DES) o FE g 的 腐蚀 的 形态 学 重建 类 似 地 定义 为 
Re (f) = EY (f) (9.6-19) 


Bk RAE EM (f= ELPA) o 
如 二 值 情况 那样 ， 灰 度 级 图 像 重建 的 开 操作 首先 腐蚀 输入 图 像 ， 并 用 它 作为 标记 图 像 。 图 像 / 的 
大 小 为 n 的 重建 开 操 作 定义 为 ， 先 对 /进行 大 小 为 n 的 腐蚀 ， 再 由 /的 膨胀 重建 ， 即 


Of (f) = RP Uf ©nb)] (9.6-20) 


式 中 ，(fBnb) 表 示 b 对 f 的 n 次 腐蚀 ， 如 9.5.7 节 解释 的 那样 。 回 忆 式 (9.5-27) 针 对 二 值 图 像 的 讨论 ， 
重建 开 操作 的 目的 是 保护 腐蚀 后 留 下 的 图 像 分 量 的 形状 。 

类 似 地 ,图 像 f 的 大 小 为 n 的 重建 闭 操 作 定义 为 ， 先 对 了 进行 大 小 为 n 的 膨胀 再 由 了 的 腐蚀 重 
Æ; Bp ， 

Ch? (f) = REIS @nb)] (9.6-21) 

IF, (f nb) KIR b 对 f 的 n 次 腐蚀 。 因 为 对 偶 性 ， 图 像 的 重建 闭 操作 可 以 用 图 像 的 求 补 得 到 ， 先 
得 到 重建 开 操作 ， 然 后 再 求 结果 的 补 。 最 后 ， 如 下 例 所 示 ， 称 为 重建 项 贴 的 一 种 有 用 技术 是 从 一 幅 图 
像 中 减 去 其 重建 开 操作 。 

例 9.11 baie a cir Bre ees 
。 在 这 个 例子 中 ， 我 们 用 规格 1 化 AH i 
AU FIRER E : 








过 执行 重建 的 开 操作 抑制 它们 。 ee stot ae LIZ ANE, A ( 即 执行 
T 将 从 原 图 像 中 消 Bk Seat SEI 








es 这 在 图 9. 44 中 非常 明显 P ea AEN 
SeN, RAT TBR ALY CEE set ene 







: es 因此 ， 我 们 不 得 不 寻找 一 种 恢复 该 字符 的 方法 。 urimin 
HE., 如 果 我 们 水 平地 膨胀 遗留 下 来 的 字符 ， 则 脱 胀 后 的 字符 将 与 先前 被 抑制 
使 大 小 为 x21 的 线 状 结构 元 膨胀 图 9.44(f) 后 ， 得 到 的 图 9.44 (g) 表明 事实 
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此 时 所 有 余下 的 问题 是 复原 被 抑制 的 字符 。 考虑 图 9.44 (g) 中 膨胀 后 的 图 像 和 图 9.44 (d) 中 重建 项 帽 图 
像 间 点 方式 的 最 小 值 形成 的 一 幅 图 像 。 图 9.44(h) 显示 了 最 小 值 图 像 (虽然 该 结果 看 起 来 接近 我 们 的 目标 ， 
但 SIN 中 仍 踪 漏 了 了 )。 在 灰 度 级 重建 中 ， 通 过 将 这 幅 图 像 作为 标记 图 像 ， 并 将 膨胀 后 的 图 像 作为 模板 
图 像 [ 见 式 (9.6-18) |, 我 们 得 到 如 图 9.44 (所 示 的 最 终结 果 。 这 幅 图 像 表明 所 有 字符 都 已 完全 从 原 图 像 
的 不 规则 背景 ， 包 括 按键 的 背景 中 提取 出 来 。 图 9.44Q 中 的 背景 都 是 均匀 的 。 


STO 


A 
ENTER 





图 9.44 (a) 大 小 为 1134x1360 像素 的 原 图 像 ; (b) 用 腐蚀 中 的 一 条 71 像素 长 的 水 平 线 
对 图 (a) 的 重建 开 操作 ; (c) 用 相同 的 线 对 图 (a) 的 开 操 作 ; (d) 重建 

(e) 顶 帽 操作 ;， (用 11 ak 长 的 水 平 线 对 图 (d) 的 重建 开 操作 ; (g) 使 用 

个 像素 长 的 水 平 线 对 图 f 的 膨胀 操作 ; (h) 图 (d) 和 图 (g) AS a (i) Fx 

后 的 重建 结果 ( 原 图 像 由 MathWork 公司 的 Steve Eddins 博士 提供 ) 


小 结 


本 章 介 绍 的 形态 学 概念 和 技术 构成 了 从 一 幅 图 像 中 提取 感 兴趣 特征 的 一 组 有 力 工 具 。 形 态 学 
图 像 处 理 最 吸引 人 的 一 个 方面 是 ,来自 形态 学 技术 已 有 发 展 的 集合 论 基 础 。 实 现 方面 的 一 个 显著 
优点 是 ， 膨 胀 和 腐蚀 都 是 基本 操作 ， 它 们 是 各 类 形态 学 算法 的 基础 。 如 下 章 所 示 ， 形 态 学 可 以 作 
为 广泛 应 用 的 图 像 分 割 程序 的 基础 。 如 第 11 章 中 讨论 的 那样 ,形态 学 技术 在 图 像 描 述 中 也 起 着 重 
要 的 作用 


参考 文献 


Serra[1982] 是 关于 形态 学 图 像 处 理 的 基础 性 参考 资料 , 也 可 参阅 Serra[1988]、Giardina and Dougherty[1988] 
fil Haralick and Shapiro[1992], 与 讨论 相关 的 其 他 早期 参考 文献 包括 Blum[1967]、Lantuéjoul[1980]、Maragos[1987] 
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和 Haralick et al[1987]。 关于 二 值 形态 学 和 灰 度 级 形态 学 的 综述 ， 见 Basart and gonzalez[1992] 和 Basart et 
al.[1992]。 这 组 参考 文献 为 9.1 节 到 9.4 节 涵 盖 的 内 容 提 供 了 丰富 的 背景 材料 。9.5 节 和 9.6 节 内 容 的 较 好 综述 
见 Soille[2003]。 

实现 形态 学 算法 (如 9.5 节 和 9.6 节 中 给 出 的 算法 ) 的 重要 刊物 见 Jones and Svalbe[1994]、 Park and Chin 
[1995], Sussner and Ritter[1997]、Anelli et al.[1998] 和 Shaked and Bruckstein[1998]。 实现 灰 度 级 形态 学 算法 的 
实践 细节 见 Vincent[1993]， 也 可 参阅 Gonzalez, Woods and Eddins[2004]。 

关于 形态 学 图 像 处 理 理论 和 应 用 的 其 他 读物 见 Goutsias and Bloomberg[2000] 和 Pattern Recongnition [2000], 
也 可 参阅 Rosenfeld[2000]。Marchand-Maillet and Sharaiha[2000] 和 Ritter and Wilson[2001] 是 关于 二 值 图 像 处 
理 和 图 像 代 数学 的 重要 文献 。 关 于 形态 学 技术 在 图 像 处 理 方面 的 应 用 的 当前 工作 ,请 参阅 Kim[2005] 和 Evans 
and Liu[2006]。 - 


Ba 标 有 星 号 的 习题 的 详细 解答 ， 
可 在 本 书 的 网 站 上 找到 。 该 网 站 中 还 
习题 包含 有 基于 本 章 内 容 而 建议 的 项 目 。 





9.1 本 书 中 的 数字 图 像 嵌 入 了 方形 排列 的 网 格 , 且 像 素 人 允许 是 4, 8 m 
连通 的 。 然 而 ， 也 可 使 用 其 他 的 网 格 排列 。 特 别 地 ， 有 时 也 会 使 用 6 连通 的 六 边 形 网 格 排列 \ 见 下 
面 的 图 形 ) 。 

(a) 如 何 将 图 像 从 方形 网 格 转换 到 六 边 形 网 格 ? 
(b) 讨论 由 方形 网 格 和 六 边 形 网 格 表示 的 物体 的 形状 旋转 不 变性 。 
(c) 在 六 边 形 网 格 中 ， 是 否 像 在 8 连通 情况 下 那样 ( 见 2.5.2 节 ) ， 可 能 存在 有 歧义 的 对 角 线 配置 ? 


WS WW oc. sD Md nN dons 2 . © © 6 @ €@ ©) @ ehe a 
G16 © ofa Oe e F268 > BS. 16 8 Ce Sele eS TA S 
he ¢ © 2 a 2 € se e258 Cu~s &€ 8 © © © S- 8 0) CURIE Te ¢ 
oe ss) 0, Ele lee 6 0 ie 86 ~GCev-e 4.2 @ 8 2S & See ze 
pip Bee Bee « & te. 6 eo SO © de) ie” ©) By 6. om Oe 
人 IT 
oe b siete o /oon 人 人 


9.2 k (a) 针对 把 4 连通 的 二 值 边界 转换 为 m 连通 的 边界 ( 见 2.5.2 节 ) 给 出 一 个 形态 学 算法 。 可 以 假设 
边界 是 全 连通 的 ， 且 边界 的 宽度 为 1 像素 。 
(b) 你 的 算法 的 操作 需要 用 每 个 结构 元 进行 多 于 一 次 的 返 代 过 程 吗 ? 试 解释 原因 。 
(c) 你 的 算法 的 性 能 是 否 与 应 用 结构 元 的 顺序 无 关 ? 如 果 你 的 回答 是 无 关 , 请 证 明之 ; 否则 请 举 
出 一 个 例子 ， 说 明 你 的 过 程 与 应 用 结构 元 的 顺序 有 关 。 
93 只 要 B 的 原点 包含 于 B 中， 结构 元 B 对 集合 4 的 腐蚀 就 是 4 的 一 个 子 集 。 给 出 腐蚀 4eB 位 于 4 
之 外 或 部 分 位 于 4 之 外 的 一 个 例子 。 
9.4 下 列 4 种 说 法 是 正确 的 。 请 给 出 能 证 明 这 些 说 法 正确 的 论据 。(a) 通常 是 正确 的 ; (b) 到 (qd) 仅 对 数 
字 集 合 才 是 正确 的 。 为 了 证 明 (b) 至 (d) 的 正确 性 ， 请 画 出 一 个 离散 的 方形 网 格 ( 如 习题 9.1 所 示 ) , 
并 针对 每 种 情况 ， 使 用 由 该 网 格 上 的 点 构成 的 集合 给 出 一 个 例子 。 (提示 : 在 仍 能 确定 这 些 说 法 的 
正确 性 时 ， 尽 可 能 保持 每 种 情况 下 的 点 数 最 少 。) 
* (a) 一 个 凸 结构 元 对 一 个 凸 集 的 腐蚀 仍 是 一 个 凸 集 。 
* (b) 一 个 凸 结构 元 对 一 个 凸 集 的 膨胀 并 不 总 是 凸 的 。 
(c) 一 个 数字 凸 集 内 的 点 并 不 总 是 连通 的 。 
(d) 有 可 能 存在 一 个 这 样 的 点 集 ， 在 该 集合 中 ， 连 接 每 个 点 对 的 线 位 于 该 集合 内 ， 但 该 集合 不 是 凸 的 。 
702] x95 参考 所 显示 的 图 像 , 给 出 生成 图 (a) 至 图 (d) 所 示 结 果 的 结构 元 和 形态 学 操作 。 请 清晰 地 说 明 每 个 结构 
K 元 的 原点 。 图 中 的 虚线 表示 原始 集合 的 边界 ， 仅 供 参考 显示 。 注 意图 (d) 中 的 所 有 角 都 是 圆 角 。 
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(a) (b) (c) (d) 
96 令 4 表 示 右 图 中 阴影 所 示 的 集合 。 参 考 所 示 的 结构 元 ( 黑 点 表示 原点 ) ， 画 出 下 列 形 态 学 操作 的 结果 : 
(a) (AOB*)@B* 一 一 一 一 
(b) (AOB')@B | | 
(c) (40B°)®B' | 
(d) (A®B*) OB “ye 
女 9.7 (a) 反复 膨胀 一 幅 图 像 的 极限 效果 是 什么 ? 
假设 不 使 用 只 有 一 个 点 的 结构 元 。 
(b) 为 使 (a) 的 答案 成 立 ， 你 能 从 其 开始 的 最 
小 图 像 是 什么 ? es 
9.8 (a) 反复 腐蚀 一 幅 图 像 的 极限 效果 是 什么 ? 
假设 不 使 用 只 有 一 个 点 的 结构 元 。 
(b) 为 使 (a) 的 答案 成 立 ， 你 能 从 其 开始 的 最 -E 
小 图 像 是 什么 ? 
*9.9 ”腐蚀 的 另 一 种 可 替换 定义 是 
AeB={we2Z |w+beA， 对 于 每 个 be B} ; | , 
证 明 该 定义 等 价 于 式 (9.2-2) 中 的 定义 。 B’ B? B Bt 


j 
< 一 一 一 ~ 








9.10 (a) 证 明 习 题 9.9 中 给 出 的 腐蚀 定义 ， 仍 等 价 于 如 下 腐蚀 的 另 一 个 定义 : 
A ƏB = NA- 


beB 
( 若 用 5b 代替 -bp， 则 该 表达 式 称 为 两 个 集合 的 闵可夫 斯 基 相 减 。) 
(b) HERH (a) 中 的 表达 式 也 等 价 于 式 (9.2-2) 的 定义 。 
x911 膨胀 的 一 个 可 替换 定义 是 
A®B={weZ°|w=a+b, 对 于 一 些 aeA4 和 beB} 
证 明 该 定义 等 价 于 式 (9.2-4) 中 的 定义 。 
9.12 (a) 证 明 习 题 9.11 中 给 出 的 膨胀 定义 ， 等 价 于 如 下 关于 膨胀 的 男 一 个 定义 : 
A®B=\| J(4), 


beB 
(该 表达 式 也 称 为 两 个 集合 的 闵可夫 斯 基 相 加 。) 
(b) 证 明 (a) 中 的 表达 式 也 等 价 于 式 (9.2-4) 中 的 定义 。 
9.13 证 明 式 (9.2-6) 和 式 (9.2-5) 中 对 偶 表 达 式 的 正确 性 。 
太 9.14 ”证明 对 偶 表 达 式 (4.B) = (AS o Ê) Fl (Ao B) = (4°) 的 正确 性 。 


703 
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9.15 证 明 下 列表 达 式 的 正确 性 : 
x (a) Ao B Æ A 的 一 个 子 集 ( 子 图 像 ) 。 
(b) 若 C 是 DD 的 一 个 子 集 ， 则 CoB 是 DoB 的 一 个 子 集 
(c) (Ao B)oB=4°0B 

9.16 oe [假设 B 的 原点 包含 在 8 中 ， 题 9.14 和 习题 9.15 为 真 : 
(a) 4 Æ A. B 的 一 个 子 集 ( 子 图 像 ) 

(b) 车 C 是 DD 的 一 个 子 集 ， 则 C.8 是 DB 的 一 个 子 集 。 
(c) (4.B). B=A.B。 

917 参考 下 图 所 示 的 图 像 和 结构 元 。 夯 出 经 如 下 操作 后 集合 C, D, E 和 
FEMA: C=4eB:D=C@B;E=DeB;F=E@B。 初始 集合 4 
由 显示 为 白色 的 所 有 图 像 分 量 组 成 ， 但 结构 元 B 除外 。 注 意 ， 这 
些 操作 仅 是 先 用 B 对 4 进行 简单 的 开 操 作 ， 接 着 用 B 对 开 操 作 的 
结果 进行 闭 操作 。 你 可 以 假设 B 刚好 大 到 包围 每 个 噪声 分 量 

x918 ”考虑 下 图 所 示 的 3 幅 二 值 图 像 。 左 侧 的 图 像 由 边 长 为 1, 3, 5, 7, 9 和 :15 像素 的 方块 组 成 。 中 间 的 
本 ai 13x13 像素 、 元 素 为 1 的 方形 结构 元 对 左 侧 图 像 进行 腐蚀 生成 的 ， 除 了 最 大 的 
几 个 之 外 ,消除 了 所 有 的 方块 。 最 后 , 右 侧 的 图 像 是 使 用 相同 的 结构 元 对 中 间 图 像 膨胀 后 的 结果 ， 
其 目的 是 恢复 最 大 的 方块 。 我 们 知道 ， 先 腐蚀 再 膨胀 实际 上 是 对 图 像 的 开 操作 ， 并 且 我 们 还 知道 
开 操作 通常 不 能 将 物体 恢复 为 原始 形式 。 请 解释 这 种 情形 下 为 何 能 完 全 重建 较 大 的 方块 








9.19 画 出 对 右 侧 图 像 应 用 击 中 或 击 不 中 变换 得 到 的 结果 和 结构 元 。 请 
清楚 地 指出 你 为 结构 元 选取 的 原点 和 边界 。 
*9.20 用 于 区 分 图 像 中 细 化 后 物体 的 三 个 特征 (湖泊 、 湖 湾 和 线段 ) 如 下 
图 所 示 。 开 发 一 种 区 分 这 些 形状 的 形态 学 /逻辑 算法 。 算 法 的 输入 
是 这 三 种 形状 之 一 。 输 出 必须 是 输入 的 特征 。 可 以 假设 这 些 特 征 
的 宽度 都 为 1 像素 ， 且 每 个 特征 都 是 完全 连通 的 ， 但 它们 出 现时 
的 方向 可 以 是 任意 的 ， 














9.21 在 下 列 每 种 情况 下 ， 讨 论 你 期 望 得 到 的 结果 是 什么 
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(a) 9.5.2 节 中 孔洞 填充 算法 的 起 始点 是 物体 边界 上 的 一 点 。 
(b) 该 孔洞 填充 算法 中 的 起 始点 位 于 物体 边界 之 外 。 
(c) 使 用 9.5.4 节 中 给 出 的 算法 ， 计 算 习 题 96 中 图 形 的 凸 壳 外 表 特 征 是 什么 。 请 画 出 计算 出 的 凸 壳 。 假 设 
LA4 GR. 
9.22 (a) 若 使 用 图 9.15 (c) 中 给 出 的 结构 元 来 替代 图 9.13 (b) 中 给 出 的 结构 元 ， 试 讨论 对 提取 边界 的 影响 。 
(b) 在 式 (9.5-2) 给 出 的 孔洞 填充 算法 中 , 若 使 用 元 素 值 为 1、 大 小 为 2 x 2 的 结构 元 代替 图 9.15 (c) 
所 示 的 结构 元 ; 请 问 会 有 什么 影响 ? 
9.23 x(a) 针对 图 9.16 中 的 自动 化 例子 ,请 提出 一 种 方法 (使 用 9.1 节 到 9.5 节 的 任何 技术 ) 。 可 以 假设 球 
体 互 不 接触 ， 并 且 不 接触 图 像 的 边界 。 
(b) 重复 (a) ， 但 允许 球体 以 任意 方式 接触 ， 包 括 接触 边界 。 
*9.24 9.5.3 节 中 给 出 的 提取 连通 分 量 的 算法 ， 要 求 在 每 个 连通 分 量 中 有 一 个 点 是 已 知 的 ， 以 便 提 取 所 有 
的 点 。 假如 你 已 有 一 幅 包 含 任意 数量 (未 知 ) 连 通 分 量 的 二 值 图 像 。 请 提出 一 种 完全 自动 化 地 提取 所 
有 连通 分 量 的 过 程 。 假 设 属于 连通 分 量 的 点 标记 为 1， 背 景点 标记 为 0。 
9.25 给 出 一 个 基于 膨胀 重建 的 、 能 提取 一 幅 二 值 图 像 中 的 所 有 孔洞 的 表达 式 。 
9.26 BF 95.9 节 中 的 孔洞 填充 算法 : 
(a) 如 果 f 的 所 有 边界 点 都 是 1， 解释 会 发 生 什么 情况 。 
(b) WÈ (a) 中 的 结果 是 你 所 希望 的 结果 , 请 解释 原因 。 如 果 不 是 , 请 解释 如 何 改 进 该 算法 ,以 便 算 
法 能 像 你 所 期 望 的 那样 工作 。 
太 9.27 如果 结构 元 是 值 为 1 的 单个 点 , 解释 二 值 图 像 的 腐蚀 和 膨胀 将 会 发 生 什么 情况 。 对 于 你 的 回答 ,请 
给 出 原因 。 
9.28 “如 式 (9.5-27) 和 9.6.4 节 中 解释 的 那样 , 重建 开 操 作 可 保持 腐蚀 后 保留 的 图 像 分 量 的 形状 。 请 问 重建 
闭 操作 的 作用 是 什么 ? 
*9.29 证 明 测 地 腐蚀 和 测 地 膨胀 ( 见 9.5.9 节 ) 关 于 补 集 对 偶 。 也 就 是 说 , 证明 EQ? (EF) =[DO [DEY (FF, 
反之 D99(F)=[E9[ES(F°)]J 。 假 定 结构 元 关于 其 原点 对 称 。 
9.30 “证 明 膨 胀 重建 和 腐蚀 重建 ( 殉 9.5.9 节 ) 关 于 补 集 对 偶 。 也 就 是 说 , 证 明 ROCF) =[RE(F OY, RIK 
然 ，RE(F)=[R2 (FV 。 假 定 结构 元 关于 其 原点 对 称 。 
女 9.31 ”提出 一 个 论据 证 明 : 
(a) [(F BnB) =(F° @nB), FEP (F OnB)] 表示 B 对 下 的 nn 次 腐 刨 。 
(b) [(F®nB) =(F°©nB). 
9.32 ”证明 二 值 重建 闭 操作 与 重建 开 操作 关于 补 集 对 偶 , BOW (F) =C (FN ,并 有 目 类 似 地 有 CP(F)= 
[OW CF’) 。 假 设 结构 元 关于 其 原点 对 称 。 
9.33 证明 下 列 灰 度 级 形态 学 表达 式 的 正确 性 。 你 可 以 假设 b 是 一 个 平坦 结构 元 。 回 忆 可 知 ，f*(x, y)= 
-f (x, y) H.B(x,y) =b(-x,-) » 
k (a) 腐蚀 和 膨胀 的 对 偶 性 : Cf Ob) = f° DEMI @b) =f ob. 
(b) (fob) = f° ob A(f 0b) = fb, 
% (o) DP) = EOE IS NEM EPA =DE (7 了。 假设 一 个 对 称 结构 元 。 
(d) R?(/)=[RE(SY URE (A) = [RE (FF o 
(e) (f Bnb) =(f° Dnb) , FH (S Onb) KIR b HLS HY n VD. 此外, (F Enb) = (f° © nb) o 
A OP =CP AN CPA =OP AN 。 假 设 结构 元 关于 其 原点 对 称 。 
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9.34 在 图 9.43 中 ， 建 立 两 个 不 同 纹理 区 域 间 的 边界 并 不 困难 。 考 虑 下 图 ， 它 显示 了 一 个 由 大 圆 区 域 包 
围 的 小 圆 区 域 。 
(a) 用 于 生成 图 9.43 (d) 的 方法 也 可 用 于 该 图 像 吗 ? 解释 你 的 理由 ,包括 为 使 且 该 方法 进行 处 理 而 需 
要 做 出 的 任何 假设 。 
(b) 如 果 你 的 回答 是 肯定 的 ， 请 画 出 边界 的 外 表 特 征 。 





9.35 一 幅 灰 度 级 图 像 f(x, y) 被 非 重 全 的 噪声 尖 刺 所 污染 ， 它 们 可 以 用 半径 为 Rain <r < Ro WEA 
Amin S 4 < Amar 的 较 小 圆柱 形 干扰 来 建 模 。 . 
* (a) 请 开发 一 种 清理 该 图 像 的 形态 学 滤波 方法 。 
(b) 重复 (a) ,但 现在 假设 最 多 存在 4 个 重合 的 噪声 尖 刺 。 
9.36 _ 显 微 应 用 中 的 一 个 预 处 理 步 又 是 ,从 两 组 或 更 多 组 重 和 的 类 似 颗粒 ( 见 右 
图 ) 中 分 离 出 单个 圆 颗 粒 。 假 设 所 有 颗粒 的 大 小 相同 ， 提 出 一 种 产生 3 
幅 图 像 的 形态 学 算法 ， 这 3 幅 图 像 分 别 仅 由 如 下 物体 组 成 : 
* (a) 仅 与 图 像 边 界 融合 在 一 起 的 颗粒 。 
(b) 仅 彼 此 重奏 的 颗粒 。 
(c) 不 重症 的 颗粒 。 
9.37 一 家 高 技术 制造 工厂 获得 了 一 份 制造 形 如 下 图 的 高 精度 垫圈 的 政府 合 
同 。 合 同 要 求 使 用 图 像 系统 来 检测 所 有 垫圈 的 形状 。 在 合同 文本 中 ， 形 
状 检 测 是 指 检测 垫圈 内 边缘 和 外 边缘 的 偏差 。 你 可 以 假定 : (1) 一 幅 可 接受 的 垫圈 的 “ 金 ” 图 像 是 
可 用 的 (关于 该 习题 而 言 的 一 幅 完美 图 像 ) ; (2) 该 系统 中 最 终 使 用 的 成 像 和 定位 系统 的 精度 ， 可 高 
到 足以 允许 你 忽略 数字 化 和 定位 引起 的 误差 。 假设 你 被 聘 为 该 系统 视觉 检测 部 分 的 顾问 。 请 基于 形 
态 学 /逻辑 操作 ， 提 出 一 种 检测 方案 。 请 以 方 框图 的 形式 给 出 你 的 答案 。 
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The whole is equal to the sum of its parts. 
Euclid 


The whole is greater than the sum of its parts. 
Max Wertheimer 
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从 前 一 章 开始 ， 所 介绍 的 内 容 就 从 输入 和 输出 都 是 图 像 的 图 像 处 理 方法 ， 转 到 了 输入 是 图 像 而 输 
出 是 从 这 些 图 像 中 提取 出 来 的 属性 的 图 像 处 理 方法 (在 1.1 节 中 的 定义 意义 上 ) 。 分 割 是 该 方向 的 另 一 个 
主要 步 又。 

分 制 将 图 像 细 分 为 构成 它 的 子 区 域 或 物体 。 细 分 的 程度 取决 于 要 解决 的 问题 。 也 就 是 说 ， 在 应 用 
中 ， 当 感 兴趣 的 物体 或 区 域 已 经 被 检测 出 来 时 ， 就 停止 分 割 。 例 如 ， 在 电子 元 件 的 自动 检测 中 ， 我 们 
关注 的 是 分 析 产 品 的 图 像 ， 客 观 地 确定 是 否 存在 特定 的 异常 现象 ， 如 元 件 缺失 或 连 线 断 裂 。 超 过 识别 
这 些 元 素 所 需 细节 的 分 割 是 没有 意义 的 。 

异常 图 像 的 分 割 是 图 像 处 理 中 最 困难 的 任务 之 一 。 分 割 的 精度 决定 了 计算 分 析 过 程 的 最 终 成 败 。 
因此 ， 应 该 对 改进 准确 分 割 的 可 能 性 给 予 相当 的 关注 。 在 某 些 情 形 下 ， 比 如 在 工业 检测 的 应 用 中 ， 至 
少 对 环境 进行 某 些 范围 的 控制 还 是 可 能 的 。 有 经 验 的 图 像 处 理 系统 设计 师 总 是 非常 关注 这 种 机 会 。 在 
其 他 应 用 中 ， 比 如 自主 目标 获取 ， 系 统 设计 者 无 法 控制 操作 环境 ， 常 用 方法 是 将 注意 力 集中 于 传感器 
类 型 的 选择 上 ， 在 减少 图 像 无 关 细节 的 影响 的 同时 ， 增 强 感 兴趣 物体 。 一 个 很 好 的 例子 是 军 方 使 用 红 
外 线 成 像 来 检测 热 特性 的 物体 ， 如 运动 中 的 装备 和 部 队 。 

本 章 中 的 多 数 分 割 算法 均 基于 灰 度 值 的 两 个 基本 性 质 之 一 ， 不 连续 性 和 相似 性 。 对 于 不 连续 的 灰 
度 ， 方 法 是 以 灰 度 突变 为 基础 分 割 一 幅 图 像 ， 比 如 图 像 的 边缘 。 对 于 相似 的 灰 度 ， 主 要 方法 是 根据 一 
组 预定 义 的 准则 把 一 幅 图 像 分 割 为 相似 的 区 域 。 闭 值 处 理 、 区 域 生长 、 广 
区 域 分 裂 和 区 域 聚合 都 是 这 类 方法 的 例子 。 本 章 讨论 和 说 明 这 些 方法 ， | 0 wertminae 
并 说 明 综合 运用 不 同方 法 来 改善 分 割 的 性 能 , 例如 , 边缘 检测 就 结合 了 
六 值 处 理 的 技术 。 我 们 还 将 讨论 基于 形态 学 的 图 像 分 割 。 这 种 方法 特别 有 吸引 力 ， 因 为 它 基于 本 章 第 
一 节 给 出 的 技术 ， 结 合 了 分 割 的 一 些 值得 肯定 的 属性 。 最 后 ,我 们 将 以 分 割 中 运动 线索 运用 的 简单 讨 
论 结束 本 章 。 


10.1 基础 知识 


令 R 表 示 一 幅 图 像 占据 的 整个 空间 区 域 . 我 们 可 以 将 图 像 分 制 视 为 把 及 分 为 "个子 区 域 R Ra …， [A 
R, 的 过 程 ， 满 足 : 
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(a) UR =R., 
i=l 


(b) RR 是 一 个 连通 集 ，i=1,2,…,n o 

(c) RNR, =O, HFA ifj, i#+jo _ 

(d) O(R,)=TRUE, i=1,2,…;ns 

(e) O(R,UR,)=FALSE ， 对 于 任何 Rj 和民 的 邻接 区 域 。 


其 中 ，Q(R) 是 定义 在 集合 Ri 的 点 上 的 一 个 逻辑 属性 ， 名 表示 空 集 。 如 2.6.4 节 中 定义 的 那样 ， 符 号 
U 和 分 别 表示 和 集合 的 并 和 交 。 如 2.5.2 节 中 讨论 的 那样 ， 若 R 和 RR 的 并 集 形成 一 个 连通 集 ， 则 我 们 
说 这 两 个 区 域 是 邻接 的 。 

条 件 (a) 指 出 ， 分 割 必须 是 完全 的 ; 也 就 是 说 ， 每 个 像素 都 必须 在 一 个 区 域内 。 条 件 (b) 要 求 一 个 
区 域 中 的 点 以 某 些 预定 义 的 方式 来 连接 ( 即 这 些 点 必须 是 4 连接 的 或 8 连接 的 ， 就 像 2.5.2 节 中 定义 的 
那样 )。 条件 (c) 指 出 , 各 个 区 域 必须 是 不 相交 的 。 条 件 (d) 涉 及 分 割 后 的 区 域 中 的 像素 必须 满足 的 属性 
一 一 例如 , 若 及 中 的 所 有 像素 都 有 相同 的 灰 度 级 , 则 O(R,) =TRUE 。 最 后 ， 条 件 (e) 指出 ， 两 个 邻接 
XIR R, FIR, ERPE O 的 意义 上 必须 是 不 同 的 ”。 

这 样 ， 我 们 看 到 ， 分 制 中 的 基本 问题 就 是 把 一 幅 图 像 分 成 满足 前 述 条 件 的 多 个 区 域 。 通 常 ， 
针对 单 色 图 像 的 分 割 算 法 处 理 两 种 类 型 的 灰 度 值 : 不 连续 性 和 相似 性 。 在 第 一 类 中 ,假设 这 些 区 
域 的 边界 彼此 完全 不 同 ， 且 与 背景 不 同 ， 因 此 允许 基于 灰 度 的 局 部 不 连续 性 来 进行 边界 检测 。 基 
于 边缘 的 分 割 是 这 一 类 中 所 用 的 主要 方法 。 第 二 类 中 基于 区 域 的 分 割 方法 是 根据 事先 定义 的 一 组 
准则 , 把 一 幅 图 像 分 割 成 相似 的 几 个 区 域 。 图 10.1 说 明了 前 述 概念 图 10.1 (a) 显示 了 一 幅 在 恒定 
灰 度 的 暗 背 景 上 仅 加 一 个 恒定 灰 度 区 域 的 图 像 。 这 两 个 区 域 构成 了 整个 图 像 区 域 。 图 10.1(b) 显示 
了 基于 灰 度 的 不 连续 性 来 计算 内 部 区 域 的 边界 所 得 到 的 结果 。 边 界 内 侧 和 外 侧 的 点 都 是 黑色 (0) , 
因为 在 这 些 区 域 中 灰 度 不 存在 不 连续 性 。 为 了 分 割 该 图 像 ， 我 们 对 该 边界 上 或 该 边界 内 的 像素 分 
配 了 一 个 灰 度 级 (譬如 白 ) ， 而 对 该 边界 外 部 的 所 有 点 分 配 了 男 一 个 灰 度 (譬如 黑 )。 图 10.1 (c) 显示 
了 这 一 处 理 方法 的 结果 。 我 们 看 到 ， 该 结果 满足 本 节 开 始 时 说 明 的 条 件 (a) 到 (ec) 。 条 件 (d) 的 属性 
E: 若 一 个 像素 位 于 边界 上 或 边界 内 ， 则 将 其 标 为 白色 ; 否则 标 为 黑色 。 我 们 看 到 ， 在 图 10.1 (c) 
中 ,对 于 标 为 黑色 和 白色 的 点 ,该 属性 为 “ 真 "。 类 似 地 ， 两 个 分 割 后 的 区 域 (物体 和 背景 ) 满足 条 
件 (e) 。 

下 面 三 幅 图 像 说 明了 基于 区 域 的 分 割 。 图 10.1 (d) 类似 于 图 10.1(a) ， 但 内 部 区 域 的 灰 度 形成 了 一 
幅 纹理 模式 。 图 10.1 (e) 显示 了 计算 该 图 像 的 边缘 的 结果 。 很 明显 ， 灰 度 中 的 大 量 寄生 变化 使 得 识别 原 
图 像 中 的 唯一 边界 很 困难 ， 因 为 很 多 非 零 灰 度 变化 连接 到 了 边界 上 ， 故 基于 边缘 的 分 割 不 是 一 种 合 
适 的 方法 。 然 而 ， 我 们 注意 到 ， 外 部 区 域 是 恒定 的 ， 因 此 ， 我 们 需要 解决 的 这 个 简单 分 割 问题 的 全 
部 ， 就 是 区 分 纹理 区 域 和 恒定 区 域 的 一 个 属性 。 像 素 值 的 标准 差 是 完成 该 任务 的 一 种 度量 ， 因 为 在 
纹理 区 域 标准 差 非 零 ， 而 在 其 他 区 域 标 准 差 为 零 。 图 10.1 (显示 了 将 原 图 像 分 成 大 小 为 4x4 的 几 个子 
区 域 后 的 结果 。 若 某 个 子 区 域 中 的 像素 的 标准 差 为 正 ( 即 如 果 属 性 为 “ 真 ”) ， 则 将 该 子 区 域 标记 为 白 
色 ; 其 他 为 零 。 结 果 是 在 区 域 边缘 周围 出 现 “ 块 ”效应 ， 因 为 4x4 方块 组 被 标记 为 相同 的 灰 度 。 最 后 ， 
注意 这 些 结果 也 满足 本 节 开 始 处 说 明 的 5 个 条 件 。 





D 一 般 来 说 ，@ 可 以 是 一 个 复合 表达 式 ， 例 如 ， 如 果 尼 中 像素 的 平均 灰 度 小 于 m;， 且 如 果 它 们 的 灰 度 的 标准 差 大 于 ops， 其 中 m 
和 Gi 是 指定 的 常数 ， 则 OCR) =TRUE。 
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图 10.1 (a) fet REPRE RAR; (b) 显示 内 部 区 域 边界 的 图 像 ， 该 图 像 是 由 灰 度 不 连续 性 获得 的 ; (c) 将 图 
像 分 割 成 两 个 区 域 后 的 结果 ; (O 包含 一 个 纹理 区 域 的 图 像 ; (e) 计算 边缘 后 的 结果 。 注 意 ， 由 于 存在 大 量 连 
接 到 原始 边界 的 小 边缘 ， 仅 使 用 边缘 信息 是 很 难 找到 一 条 唯一 的 边界 的 ; (基于 区 域 特性 的 分 割 结果 


10.2 点、 线 和 边缘 检测 


本 节 主 要 介绍 以 灰 度 局 部 剧烈 变化 检测 为 基础 的 分 割 方法 ,我 们 感 兴趣 的 三 种 图 像 特 征 是 孤立 点 、 

线 和 边缘 。 边缘 像素 是 图 像 中 灰 度 突变 的 那些 像素 , 而 边缘 (或 边缘 线段 ) 是 相连 边缘 像素 的 集合 (关于 连 

接 性 的 定义 ， 见 2.52 节 ) 。 边 缘 检 测 器 是 设计 用 来 检测 边缘 像素 的 局 部 图 像 处 理 方法 。 一 条 线 可 视 为 一 条 

边缘 线段 , 该 线 两 侧 的 背景 灰 度 要 么 远 亮 于 该 线 的 像素 的 灰 度 , 要 么 远 暗 于 该 线 的 像素 的 灰 度 。 事实 上 

如 下 节 及 10.2.4 节 中 讨论 的 那样 ， 线 会 引起 所 谓 的 “屋顶 边缘 ”。 类 似 地 ， 
孤立 点 可 视 为 一 条 线 ， 只 是 其 长 度 和 宽度 都 为 一 个 像素 。 

， 壁 如 数字 化 后 的 建筑 设计 图 ! 中 的 | 


10.2.1 背景 知识 或 卫星 图 像 中 的 道路 | 


如 在 2.6.3 节 和 3.5.1 节 我 们 所 看 到 的 局 部 平均 平滑 一 幅 图 像 那样 ， 假 设 平均 处 理 类 似 于 积 by, 对 
于 灰 度 的 突变 ， 局 部 变化 可 以 用 微分 来 检测 应 该 并 不 奇怪 。 由 于 变化 非常 短促 ， 因 此 一 阶 微分 和 二 阶 
微分 特别 适合 于 这 种 目的 。 

数字 函数 的 导数 可 用 差分 来 定义 。 就 像 3.6.1 节 中 解释 的 那样 ， 近 似 这 些 差 分 的 方法 有 多 种 ， 但 
对 于 用 于 一 阶 导数 的 任何 近似 ， 我 们 要 求 : O) 在 恒定 灰 度 区 域 必须 为 零 ; (2) 在 灰 度 台阶 或 斜坡 开 
始 处 必须 不 为 零 ; (3) 在 沿 灰 度 斜坡 点 处 也 必须 不 为 零 。 类 似 地 ， 对 于 所 用 的 二 阶 导数 的 近似 ， 我 们 
BER: (1) 在 恒定 灰 度 区 域 必须 为 零 ; (2) 在 灰 度 台阶 或 斜坡 的 开始 处 
和 结束 处 必须 不 为 零 ; (3) 沿 灰 度 斜 披 必 须 为 零 。 因 为 我 们 处 理 的 是 数 
FE, 故 它们 的 值 是 有 限 的 , 最 大 可 能 的 灰 度 变化 也 是 有 限 的 , HEH 
上 发 生变 化 的 最 短 距离 是 在 两 个 邻接 像素 间 的 距离 。 

我 们 按 如 下 方式 来 得 到 一 维 函 数 f(x) 在 点 x 处 的 导数 的 近似 : 将 函数 f(x+Ax) 展开 为 关于 x 的 泰 
勒 级 数 ， 令 Ax =1 ， 且 只 保留 该 级 数 的 线性 项 (见习 题 10.1) 。 结果 是 数字 差分 









当 我 们 说 到 线 时 , 实际 上 是 指 | 
pagel 它 通常 只 有 几 个 像素 












回忆 2.4.2 节 可 知 ， 为 表达 清晰 ， | 
图 像样 本 间 的 增 量 定义 为 1， 因 此 在 
式 (10.2-1) 的 推导 中 使 用 了 Ax = 1 | 


m 


L- P= fat- SO) (10.2-1) 
X 


UFR EET PIG ORL f(x, 时 ， 为 了 表示 的 一 至 性， 这 里 我 们 使 用 了 偏 微分 。 此 时 , 我 A 


们 将 处 理 沿 两 个 空间 轴 的 偏 微分 。 很 明显 ， 当 函数 1 只 有 一 个 变量 时 , A Of / Ox =df /dx。 
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对 式 (10.2-1) 关 于 x 微分， 我 们 得 到 一 个 二 阶 导数 表达 式 : 


27 ~t 
LPD fet- f'a) 
Ox Ox 


= f(x+2)=f(x4l)— f(xt+ I+ f(x) 

= f(x+2)-2f(x+1)+ f(x) 
式 中 ， 第 二 行 来 自 式 (10.2-1) 。 这 一 展开 是 关于 点 x+ 1 的 。 我 们 的 兴趣 是 关于 点 x 的 二 阶 导数 ， 故 将 
上 式 中 的 变量 减 1 后 ， 得 到 








TL = ("x)= f+D)+ /Ce-D)-2/0 (10.2-2) 
X 

很 容易 证 明 式 (10.2-1) 和 式 (10.2-2) 满 足 本 节 开 始 时 说 明 的 关于 一 阶 和 二 阶 导 数 的 条 件 。 为 了 说 明 这 一 
点 ， 并 强调 一 阶 导数 和 二 阶 导数 在 图 像 处 理 中 的 基本 相同 点 和 不 同 点 ， 考 虑 图 10.2。 


图 10.2 (a) 显示 了 一 幅 图 像 ， 该 图 像 中 包含 有 不 同 的 实心 物体 、 一 条 线 和 单个 噪声 点 。 图 10.2 (b) 
显示 了 近似 通过 该 图 像 中 心 的 水 平 灰 度 剖面 (扫描 线 ) ， 其 包括 孤立 点 。 实 心 物体 和 沿 扫描 线 的 背景 之 
间 的 灰 度 过 渡 显 示 了 两 种 类 型 的 边缘 : 斜坡 边缘 ( 左 侧 ) 和 台阶 边缘 ( 右 侧 ) 。 如 稍 后 我 们 要 讨论 的 那样 ， 
灰 度 过 渡 涉 及 较 细 物体 ， 如 常 称 为 屋顶 边缘 的 线 。 图 10.2(c) 显示 了 剖面 线 的 简化 ,构成 曲线 的 点 刚好 
足够 我 们 在 过 到 一 个 噪声 点 、 一 条 线 和 物体 的 边缘 时 ， 在 数量 上 分 析 一 阶 导 数 和 二 阶 导数 的 特性 。 在 
这 幅 简 化 图 中 ， 和 斜坡 的 过 渡 跨 越 4 个 像素 ， 品 声 点 是 单个 像素 , 线 为 3 个 像素 粗 ， 灰 度 台 阶 的 过 渡 发 
生 在 邻接 像素 间 。 为 简化 起 见 ， 灰 度 级 数 限制 为 8 级 。 



































F PE A es 
6 1 
5 ea H D 1 
3 4 oe 斜坡 if 线 shes 
3 了 Air OK i 
2 x | \ J N H 
1 ‘ea I i ¥ Bo 1 
0 ~oo- o-e -0- -0 w o-e-4 
mee bls beL] lololo ph euo obp r EELEE 
a F L ETERS l S EAE] 
z 一 阶 导数 -1-1-1-1-10 0 6-60 0 0 1 22-10007000 


ee he a T 


二 阶 导数 -10 0 0 0 1 0 6-1260 Ò 1 1-41 1007-700 

K 10.2 (a) AVR; O 通过 该 图 像 中 心 的 水 平 灰 度 剖面 ， 包 括 孤 立 噪 声 点 ; (c) 简化 后 的 剖 
MA 为 清楚 起 见 ， 点 已 用 虚线 连接 起 来 ) 。 图 像 条 带 对 应 于 灰 度 剖面 曲线 ， 方 框 中 
的 数字 是 剖面 线 中 所 示 的 点 的 灰 度 值 。 导 数 是 使 用 式 (10.2-1) 和 式 (10.2-2) 得 到 的 
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现在 我 们 考虑 从 左 到 右 横 穿 该 剖面 时 一 阶 导 数 和 二 阶 导数 的 性 质 。 首 先 ， 我 们 注意 到 在 灰 度 斜坡 
的 开始 处 并 沿 着 整个 灰 度 斜坡 ， 一 阶 导 数 不 为 零 ， 同 时 二 阶 导 数 仅 在 斜坡 的 开始 处 和 结尾 处 不 为 零 。 
因为 数字 图 像 的 边缘 类 似 于 这 种 类 型 的 过 渡 ， 故 我 们 断定 一 阶 导 数 会 产生 “ 粗 ” 边 缘 ， 而 二 阶 导数 则 
会 产生 细 得 多 的 边缘 。 接 下 来 ， 我 们 遇 到 孤立 噪声 点 。 该 点 处 的 二 阶 导数 响应 幅度 远 强 于 一 阶 导 数 响 
应 幅度 。 这 并 不 意外 ， 因 为 在 增强 剧烈 变化 方面 ， 二 阶 导数 要 比 一 阶 导数 更 为 激进 。 这 样 ， 我 们 就 可 
以 预期 ， 在 增强 细节 (包括 噪声 ) 方 面 ， 二 阶 导 数 远 强 于 一 阶 导数 。 在 本 例 中 线 是 如 此 之 细 ， 以 至 于 它 
也 是 更 精细 的 细节 , 并 且 我 们 再 次 看 到 二 阶 导数 的 幅度 更 大 。 最 后 , 我 们 注意 到 在 斜坡 和 台阶 边缘 中 ， 
进入 边缘 和 离开 边缘 过 渡 时 的 二 阶 导 数 的 符号 相反 (从 负 到 正 或 从 正 到 负 ) 。 如 我 们 在 10.2.6 节 中 显示 的 那 
样 ， 这 种 “双边 缘 效应 ”是 可 用 于 定位 边缘 的 一 种 重要 特性 。 二 阶 导 数 的 符号 也 可 用 于 确定 一 个 边缘 
是 从 亮 到 上 暗 ( 负 二 阶 导数 ) 过 渡 还 是 从 暗 到 亮 ( 正 二 阶 导 数 ) 过 渡 ， 这 里 ， 当 我 们 移 进 边缘 时 ， 就 观察 到 
这 个 符号 。 
总 之 , 我 们 得 出 如 下 结论 : (1) 一 阶 导数 通常 在 图 像 中 产生 较 粗 的 边缘 ; (2) 二 阶 导数 对 精细 细节 ， 
如 细 线 、 释 立 点 和 噪声 有 较 强 的 响应 ; (3) 二 阶 导 数 在 灰 度 斜坡 和 灰 度 台阶 过 渡 处 会 产生 双边 缘 响应 ; 
(4) 二 阶 导数 的 符号 可 用 于 确定 边缘 的 过 渡 是 从 亮 到 暗 还 是 从 暗 到 亮 。 
计算 图 像 中 每 个 像素 位 置 处 的 一 阶 导 数 和 二 阶 导数 的 另 一 种 方法 是 使 用 空间 滤波 器 。 对 于 图 10.3 
中 的 3x3 滤波 器 模板 , 该 过 程 是 计算 模板 系数 与 被 该 模板 覆盖 区 域 中 的 灰 度 值 的 乘积 之 和 。 也 就 是 说 ， 
参考 式 (3.4-3) ， 模 板 在 该 区 域 中 心 点 处 的 响应 是 
9 
R= WZ, + WZ +--+ WZ =) wa (10.2-3) 
k=l 
其 中 z 是 像素 的 灰 度 ， 该 像素 的 空间 位 置 对 应 于 模板 中 第 上 
个 系数 的 位 置 。3.4 节 和 3.6 节 已 详细 讨论 了 对 图 像 中 所 有 像 
素 执行 这 种 操作 的 细节 。 换 名 话说 ， 基 于 空间 模板 的 导数 的 计 
算 , 是 用 这 些 模板 对 一 幅 图 像 进行 空间 滤波 ， 正 如 在 那些 章节 
描述 的 那样 "。 


10.2.2 ”孤立 点 的 检测 
基于 前 一 节 得 到 的 结论 ， 我 们 可 知 点 的 检测 应 以 二 阶 导 





数 为 基础 。 由 3.6.2 节 的 讨论 ， 这 意味 着 使 用 拉 普 拉 斯 算 子 。 图 103 一 个 普通 的 3x3 空间 滤波 器 拖 模 
vf (x, y) -人 + 全 (10.2-4) 
式 中 ， 偏 微分 用 式 (10.2-2) 得 到 : 
PLE). S(x+1, y)+ f(x, »)-2F(%, ») (10.2-5) 
和 
LD jG yth fe,y-D 2/0 (10.2-6) 


D 1K 3.4.3 节 中 解释 的 那样 ， 式 (10.2-3) 要 么 是 由 式 (3.4-1) 给 出 的 空间 相关 的 简化 表示 ， 要 么 是 由 式 (3.4-2) 给 出 的 空间 卷 积 的 简化 
表示 。 因 此 ， 当 在 一 幅 图 像 中 的 所 有 位 置 处 计算 RR 时 ， 结 果 都 是 一 个 阵列 。 本 章 中 的 所 有 空间 滤波 操作 都 是 使 用 相关 完成 的 。 
在 某 些 情形 下 ,我 们 通常 会 使 用 术语 “模板 与 图 像 卷 积 ”。 但 是 , 我 们 仅 在 滤波 器 是 对 称 滤 波 器 时 才 使 用 这 一 术语 ， 因 为 这 一 情 
形 下 相关 和 卷 积 会 产生 相同 的 结果 。 


~ 
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故 拉 普 拉 斯 算 子 是 

V* f(x, y)= f(x+1, y+ f(x-1, y)+ f(x, yt 1) + f(x, yp-D—-4 f(x, y) (10.2-7) 
如 3.6.2 节 中 解释 的 那样 ， 该 表达 式 可 以 用 图 3.37 (a) 中 的 模板 来 实现 。 些 外 ， 如 该 节 描 述 的 那样 ， 我 
们 可 以 把 式 (10.2-7) 扩 展 到 包含 对 角 项 , 并 使 用 图 3.37 (b) 中 的 模板 。 使 用 图 10.4 (a) 中 的 拉 普 拉 斯 模板 ， 
它 与 图 3.37 (b) 中 的 模板 相同 ， 如 果 在 某 个 点 处 ， 该 模板 的 响应 的 绝对 值 超过 了 某 个 指定 的 浆 值 , 那么 
我 们 说 在 模板 中 心 位 置 (x, y) 处 的 该 点 已 被 检测 到 。 在 输出 图 像 中 ， 这 样 的 点 被 标注 为 1， 而 所 有 其 他 
点 则 被 标注 为 0， 从 而 产生 一 幅 二 值 图 像 。 换 句 话 说， 输出 是 使 用 如 下 表达 式 得 到 的 ; 
Ly Ry) | ez 
0, 其 他 
式 中 ，g 是 输出 图 像 ，7 是 一 个 非 负 的 冰 值 ，R 由 式 (10.2-3) 给 出 。 该 式 简 单 地 度量 一 个 像素 及 其 8 个 
相 邻 像素 间 的 加 权 差 。 从 直观 上 看 ， 这 一 概念 是 一 个 孤立 点 的 灰 度 将 完全 不 同 于 其 周围 像素 的 灰 度 ， 因 
而 ， 使 用 这 种 类 型 的 模板 可 很 容易 地 检测 出 这 个 孤立 点 。 考 虑 的 重点 仅仅 是 灰 度 的 不 同 对 于 研究 孤立 点 已 
很 充分 。 注 意 ， 对 于 一 个 导数 模板 而 言 ， 这 些 系数 之 和 为 零 通常 表明 在 恒定 灰 度 区 域 模 板 响应 将 是 0 


g(x, y)= | (10.2-8) 





| ] 1 


a 
bed 
































图 10.4 (a) 点 检测 ( 拉 普 拉 斯 ) 模板 ; (b) 带 有 一 个 通 孔 的 涡轮 叶片 的 X 射线 图 像 。 该 通 孔 含 
有 一 个 黑色 像素 ;(c) 模 板 与 图 像 卷 积 的 结果 ; (d) 使 用 式 (10.2-8) 得 到 的 结果 , 结果 中 
显示 了 一 个 点 (为 便于 观看 ， 该 点 已 被 放大 ) ( 原 图 像 由 X-TEK Systems 有 限 公司 提供 ) 


例 10.1 图 像 中 孤立 点 的 检测 。 

借助 于 图 10.4(b) ,我 们 来 说 明 如 何 从 一 幅 图 像 中 将 孤立 点 分 割 出 来 。 该 图 像 是 一 幅 喷气 发 动机 
涡轮 叶片 的 XX 射线 图 像 。 图 像 右 上 象限 的 叶片 中 有 一 个 通 孔 ; 通 孔 中 租 入 了 一 个 黑色 像素 , 图 10.4 (c) 
是 将 点 检测 模板 应 用 到 该 幅 X 射线 图 像 后 的 结果 , 图 10.4(d) 显示 了 了 T 取 图 10.4(c) 中 像素 的 最 高 绝对 
值 的 90% 时 ， 应 用 式 (10.2-8) 所 得 到 的 结果 。 在 这 幅 图 像 中 ,这 个 像素 清晰 可 见 (为 增加 可 视 性 ， 该 像 
素 已 被 人 为 放大 ) 。 这 种 类 型 的 检测 过 程 相 当 特 殊 ， 因 为 它 基于 单个 像素 位 置 处 的 灰 度 突变 ， 这 些 位 


5 下” 置 被 检测 模板 区 域 中 的 同 质 背景 所 围绕 。 当 这 一 条 件 不 满足 时 ， 本 章 中 讨论 的 其 他 方法 会 更 适合 于 检 


测 灰 度 变化 。 
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10.2.3 RE 


复杂 度 更 高 的 检测 是 线 检测 。 基 于 10.2.1 市 中 的 讨论 ,我们 知道 ， 对 于 线 检测 ， 可 以 预期 二 阶 导 
数 将 导致 更 强 的 响应 ,并 产生 比 一 阶 导数 更 细 的 线 。 这 样 ， 对 于 线 检测 ,我 们 也 可 使 用 图 10.4 (a) 中 的 
拉 普 拉 斯 模板 ， 记 住 ， 必 须 适 当 处 理 二 阶 导数 的 双 线 效应 。 下 面 的 例子 说 明了 这 一 处 理 过 程 


例 10.2 用 拉 普 拉 斯 进行 线 检测 。 

图 10.5 (2) 显示 了 一 幅 486x486 电路 连 线 掩 模 的 一 部 分 (二 值 图 像 ) ,图 10.5 (b) 显示 了 其 拉 普 拉 斯 图 像 。 
因为 拉 普 拉 斯 图 像 包含 有 负 值 "， 为 便于 显示 ， 需 要 调整 比例 。 如 放大 部 分 显示 的 那样 ， 中 等 灰 度 表 示 有 零 ， 
较 暗 的 灰色 调 表示 负 值 ， 而 较 亮 的 色调 表示 正 值 。 在 放大 部 分 ， 双 线 效应 清晰 可 见 。 

首先 ， 负 值 看 起 来 可 通过 取 拉 普 拉 斯 图 像 的 绝对 值 来 简单 地 处 理 。 然 而 , 如 图 10.5 (c) 所 示 ， 该 方法 会 
使 线 的 宽度 加 倍 。 王 种 更 合适 的 方法 是 ， 仅 使 用 拉 普 拉 斯 的 正 值 (在 有 噪声 的 情形 下 ,我 们 使 用 超过 正 较 
值 的 那些 值 ， 去 掉 那 些 由 噪声 导致 的 零 附近 的 随机 变化 )。 如 图 10,5 (d) 中 的 图 像 所 示 ， 这 种 方法 产生 了 更 
细 的 线 ， 但 这 些 线 更 有 用 。 -注意 ， 在 图 10.5 (b) 到 图 10.5 (d) 中 ， 当 线 的 宽度 比 拉 普 拉 斯 模板 的 尺寸 宽 时 ， 
这 些 线 就 被 一 个 零 值 “山谷 ”分 开 。 


a bed 





图 10.5 (a) 原 图 像 ; (b) 拉 普 拉 斯 图 像 ， 放 大 部 分 显示 了 拉 普 拉 斯 的 
正 / 负 双 线 效应 ; (ce) 拉 普 拉 斯 的 绝对 值 ，(d) 拉 普 拉 斯 的 正 值 


这 是 预料 之 中 的 : 例如 ， 当 把 这 个 3x3 滤波 器 居中 放 在 一 条 宽 为 5 个 像素 的 恒定 灰 度 线 上 时 ， 其 响应 
将 为 零 ， 这 样 就 产生 了 刚才 提 到 的 效应 。 当 我 们 谈论 线 检 测 时 ， 假 设 这 些 线 要 细 于 检测 子 的 尺寸 。 不 满足 
这 一 假设 的 线 ， 我 们 最 好 把 它 当 作 区域 ， 并 使 用 本 节 稍 后 讨论 的 边缘 检测 方法 来 处 理 。 


图 10.4 (a) 中 的 拉 普 拉 斯 检测 子 是 各 向 同性 的 ， 因 此 其 响应 与 方向 无 关 ( 相 对 于 该 3x3 拉 普 拉 斯 模 
板 的 4 个 方向 : 垂直 方向 、 水 平方 向 和 两 个 对 角 方 向 ) 。 通 常 ， 我 们 的 兴趣 在 于 检测 特定 方向 的 线 。 考 
虑 图 10.6 中 的 模板 。 假 设 使 用 第 一 个 模板 对 一 幅 具 有 恒定 背景 并 包含 各 种 线 (方向 为 0? ，+45° 和 90°) 
的 图 像 进 行 滤波 。 最 大 响应 将 出 现在 图 像 中 通过 该 模板 中 间 行 的 一 条 水 平 线 处 。 通 过 勾画 一 个 元 素 为 
1 的 简单 阵列 ， 并 面 一 条 水 平 穿越 该 阵列 的 具有 不 同 灰 度 (假设 为 5) 的 [ae De 入 可 知 图 像 轴 约定 如 | 
线 , 可 很 容易 地 验证 这 一 点 。 类似 的 实验 表明 , 图 10.6 中 的 第 二 个 模板 | 下: 原点 位 于 左上 角 ， 正 x 轴 指向 下 | 
对 于 45° 方 向 的 线 有 最 佳 响应 ; 第 三 个 模板 对 于 垂直 线 有 最 佳 响应 ; 第 |A 正 》 轴 指向 右 方 。 本 节 中 讨论 的 
四 个 模板 对 于 45* 方 向 的 线 有 最 人 Eni) k 每 个 模板 的 首选 方向 用 一 个 | 线 的 角度 是 指 相对 于 正 x 轴 度量 的 角 
APRA T AAS P E E a O |x 例如 ,垂直 线 的 角度 为 0。 ,+45。 | 
比 其 他 方向 更 大 的 系数 (如 2) 加权。 每 个 模板 中 的 系数 之 和 为 零 , 这 表 | sees Fane 
明 恒 定 灰 度 区 域 中 的 响应 为 去 pa sos! 














D 当 其 系数 之 和 为 零 的 掩 模 与 一 幅 图 像 进行 卷 积 时 ， 结 果 图 像 中 的 像素 之 和 也 为 零 (见习 题 3.16) ， 这 表明 结果 中 存在 正 像素 和 负 Ir 


像素 。 比 例 调节 的 目的 是 ， 使 所 有 的 负 值 适合 于 显示 
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垂直 
图 10.6 线 检测 模板 。 角 度 是 相对 于 图 2.18 (b) 中 的 坐标 轴 系 统 的 


4 R, Ry, R AR, RARE 10.6 中 从 左 到 右 的 各 个 模板 的 响应 , 其 中 R 值 由 式 (10.2-3) 给 出 。 假设 使 
用 这 4 个 模板 对 一 幅 图 像 滤 波 。 在 该 图 像 中 的 某 个 给 定点 处 ， 若 对 于 rT te 
所 有 j #k ARA> Ril, 则 称 该 点 可 能 与 模板 方向 的 一 条 线 更 相似 。 例 “| i 而 101 闻 中 则 用 来 表示 区 域 , 请 
如 ,， 若 在 图 像 中 的 某 个 点 处 ,， 对 于 j=2,3,4 有 |Ri|>|R|， 则 说 该 点 可 能 | 不 要 混淆 。 
与 一 条 水 平 线 更 相似 。 换 句 话说 ,我 们 可 能 对 检测 特定 方向 上 的 线 感 兴 
趣 。 在 这 种 情况 下 ， 我 们 会 使 用 与 该 方向 相关 的 模板 ， 并 对 其 输出 进行 国 值 处 理 ， 就 像 在 式 (10.1-2) 中 
那样 。 换 名 话说 ， 若 我 们 对 检测 图 像 中 由 给 定 模板 定义 的 方向 上 的 所 有 线 感 兴趣 ， 则 只 须 简 单 地 对 该 
图 像 运 行 这 个 模板 ， 并 对 结果 的 绝对 值 进行 闵 值 处 理 。 留 下 的 点 是 有 最 强 响 应 的 点 ， 对 于 1 个 像素 宽 
度 的 线 来 说 ， 相 应 的 点 最 接近 于 模板 定义 的 方向 。 下 例 说 明了 这 一 过 程 。 








于 图 10.7(e) 中 的 最 大 信 图 107 | 10.7(6) 
中 的 图 像 。 该 图 中 的 孤立 点 是 对 iea 
PAEA tne ,然后 删除 


10.2.4 ”边缘 模型 


边缘 检测 是 基于 灰 度 突变 来 分 割 图 像 的 常用 方法 。 我 们 先 介 绍 一 些 边缘 建 模 的 方法 ， 然 后 讨论 一 
些 边 缘 检 测 方法 。 

边缘 模型 根据 它们 的 灰 度 剖面 来 分 类 。 台 阶 边缘 是 指 在 1 像素 的 距离 上 出 现 两 个 灰 度 级 间 的 理 
想 过 渡 。 图 10.8 (a) 显示 了 一 个 垂直 台阶 边缘 的 一 部 分 和 通过 该 边缘 的 一 个 水 平 痢 面 。 例 如 ,用 于 诸 
如 固体 建 模 和 动画 领域 的 、 出 现在 由 计算 机 生成 的 图 像 中 的 台阶 边缘 。 这 些 清晰 、 理 想 的 边缘 可 出 
现在 1 像素 的 距离 上 ， 不 需要 提供 任何 使 它们 看 上 去 “很 真实 ”的 附加 处 理 ( 如 平滑 ) 。 在 算法 开发 
中 ， 数 字 台 阶 边 缘 常用 做 边缘 模型 。 例 如 ，10.2.6 节 中 讨论 的 坎 尼 边缘 检测 算法 就 是 用 一 个 台阶 边 
缘 模 型 推导 的 。 
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def 


图 10.7 (a) 接线 板 掩 模 图 像 ; (b) 使 用 图 10.6 中 的 +45" 线 检测 子 模板 处 理 后 的 结果 ; (c) E (b) 左上 方 区 域 
的 放大 观察 图 ; (d) 图 (b) 右 下 区 域 的 放大 观察 图 ; (e) 将 图 (b) 中 所 有 负 值 置 为 零 后 的 图 像 ， 介 其 
值 满足 条 件 g 兰 工 的 所 有 点 ( 自 色 ) ， 其 中 g 是 图 (e) 中 的 图 像 [ 为 便于 查看 ， 图 路 中 的 点 已 被 放大 ] 








5 eae 


图 10.8 从 左 到 右 分 别 为 一 个 台阶 模型 、 一 个 斜坡 模型 和 一 个 屋顶 边缘 模型 (理想 表示 ) 及 它们 的 相应 灰 度 削 面 


实际 中 ， 数 字 图 像 都 存在 被 模糊 且 带 有 噪声 的 边缘 ,模糊 的 程度 主要 取决 于 聚焦 机 理 (如 光学 成 
像 中 的 镜头 ) 中 的 限制 , 而 噪声 水 平 主要 取决 于 成 像 系统 的 电子 元 件 。 在 这 种 情况 下 , 边缘 被 建 模 为 一 
个 更 接近 灰 度 斜坡 的 剖面 ， 如 图 10.8 (b) 中 的 边缘 。 斜坡 的 斜 度 与 边缘 的 模糊 程度 成 反比 。 在 这 一 模型 
中 ,不 再 存在 一 条 细 的 (1 像素 宽 ) 轨迹 。 相 反 ， 一 个 边缘 点 现在 是 斜坡 中 包含 的 任何 点 ， 而 一 条 边缘 
线段 将 是 一 组 已 连接 起 来 的 这 样 的 点 

边缘 的 第 三 种 模型 是 所 谓 的 “屋顶 ”边缘 ， 这 种 边缘 具有 图 10.8 (c) 所 示 的 特性 。 屋 项 边 缘 是 通过 

一 个 区 域 的 线 的 模型 ， 屋 顶 边缘 的 基底 (宽度) 由 该 线 的 宽度 和 尖锐 度 决定 。 在 极限 情形 下 ， 当 其 基 

底 为 1 像素 宽 时 ， 屋 顶 边缘 只 不 过 是 一 条 穿 过 图 像 中 一 个 区 域 的 一 条 1 像素 宽 的 线 。 例 如 ， 在 深度 成 
像 中 ， 当 细 物 体 ( 如 管子 ) 比 等 距离 的 背景 (如 墙 ) 更 接近 传 感 右 时 ， al 管道 更 亮 ， 因 
而 产生 了 一 幅 类 似 于 图 10.8 (c) 中 模型 的 图 像 。 如 先前 提 及 的 那样 ， 经 常 出 现 屋顶 边缘 的 其 他 领域 是 在 
数字 化 的 线条 图 和 卫星 图 像 中 ， 此 时 如 道路 这 样 的 较 细 特征 可 由 这 种 类 型 的 边缘 建 模 . 

包含 所 有 三 种 类 型 边缘 的 图 像 并 不 罕见 。 虽 然 模 糊 和 噪声 会 导致 与 理想 形状 的 偏差 ， 但 图 像 中 有 
适当 锐 度 和 适中 噪声 的 边缘 确实 存在 类 似 于 图 10.8 中 边缘 模型 的 特性 ， 如 图 10.9 图 10.8 
中 的 模型 允许 我 们 在 图 像 处 理 算法 的 开发 中 写 出 边缘 的 数学 表达 式 。 这 些 算 法 的 性 能 将 取决 于 实际 边 
缘 和 在 算法 开发 中 所 用 模型 之 间 的 差别 。 

图 10.10(a) 显示 了 从 图 10.8(b) 的 一 段 中 提取 出 来 的 一 幅 图 像 。 图 10.10(b) 显示 了 一 条 水 平 灰 度 剖面 
线 。 该 图 形 还 显示 了 灰 度 剖面 的 一 阶 导 数 和 二 阶 导 数 。 如 10.2.1 节 中 讨论 的 那样 ， 当 沿 着 灰 度 i 
到 右 移动 时 ， 我 们 注意 到 ， 在 斜坡 的 开始 处 和 在 斜坡 上 的 各 个 点 处 ， 一 阶 导 数 为 正 。 而 在 恒定 灰 





D 有 着 几 个 像素 的 剧烈 斜率 的 斜坡 边缘 , 通常 被 当做 台阶 边缘 处 理 , 目的 是 由 同一 图 像 中 斜率 更 为 舒缓 的 斜坡 来 对 它们 进行 微分 
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区 域 的 一 阶 导 数 为 零 。 在 斜坡 的 开始 处 ,二 阶 导 数 为 正 ; 在 斜坡 的 结束 处 ,二 阶 导 数 为 负 ; 在 斜坡 上 的 各 点 
处 ,二 阶 导数 为 零 ; 在 恒定 灰 度 区 域 的 各 点 处 ， 二 阶 导数 为 零 。 对 于 从 亮 到 暗 过 渡 的 边缘 ， 刚 刚 讨论 的 导 
数 的 符号 则 正好 相反 。 零 灰 度 轴 和 二 阶 导 数 极 值 间 的 连 线 的 交点 ， 称 为 该 二 阶 导 数 的 零 交 叉 点 





图 10.9 显示 了 (放大 后 的 ) 实 际 和 斜坡 (左下 ) ,台阶 (右上 ) 和 屋顶 边缘 剖面 的 一 幅 大 小 为 1508x1970 的 图 像 

在 由 小 圆 所 示 短 线段 指出 的 区 域 中 , 前 面 从 暗 到 亮 。 斜坡 和 台阶 齐 面 分 别 跨越 9 个 像素 和 2 MR 

素 。 屋 项 边缘 的 基底 是 3 个 像素 ( 原 图 像 由 Vanderbilt 大 学 的 David R. Pickens 博士 提供 ) 
由 这 些 观察 我 们 可 以 得 出 结论 : 一 阶 导数 的 幅度 可 用 于 检测 图 像 中 的 某 个 点 处 是 否 存 在 一 个 边 
缘 。 同 样 ， 二 阶 导数 的 符号 可 用 于 确定 一 个 边缘 像素 是 位 于 该 边缘 的 暗 侧 还 是 位 于 该 边缘 的 亮 人 出。 我 
们 注意 到 围绕 一 条 边缘 的 二 阶 导数 的 两 个 附加 性 质 : (1) 对 图 像 中 的 每 条 边缘 ,二 阶 导数 生成 两 个 值 (一 
个 不 希望 的 特点 ) ; (2) 二 阶 导数 的 零 交 叉 点 可 用 于 定位 粗 边缘 的 中 心 ， 正 如 我 们 将 在 本 节 稍 后 将 要 说 
明 的 那样 。 某 些 边缘 模型 可 用 来 在 进入 和 离开 斜坡 的 地 方 平 滑 过 渡 ( 见 习题 10.7) 。 然 而 ， 使 用 这 些 模 
型 得 到 的 结论 与 使 用 一 个 理想 斜坡 得 到 的 结论 相同 ， 且 用 后 者 可 简化 理论 公式 。 最 后 ， 尽 管 迄 今 为 止 
我 们 的 注意 力 限制 在 一 维 水 平 剖面 上 ,但 类 似 的 结论 适用 于 图 像 中 任何 方向 的 边缘 。 我 们 简单 地 定义 了 
一 个 在 任何 期 望 的 点 与 边缘 方 回 垂直 的 剖面 , 并 用 刚 讨论 的 与 垂直 边缘 相同 的 方法 , 对 结果 进行 了 解释 。 


e 全 a b 
水 平 灰 度 剖面 
- 阶 导数 
二 阶 导 数 






exy—/ 


图 10.10 (a) 由 一 条 理想 垂直 边缘 分 开 的 两 个 恒定 灰 度 区 域 ; tb) 边 缘 附近 
的 细节 ， 显 示 了 一 个 水 平 灰 度 剖面 及 其 一 阶 导 数 和 二 阶 导数 
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例 10.4” 带 噪 边缘 的 一 阶 导 数 和 二 阶 导数 的 性 质 。 a wae 

图 10.8 中 的 边缘 是 无 噪声 的 。 图 10.11 中 第 一 列 图 像 段 是 4 个 斜坡 边 节 中 讨 沦 。 现 在 ,我 们 的 目的 只 是 分 
缘 的 特写 ， 这 些 边 缘 从 左边 的 黑色 区 域 到 右边 的 白色 区 域 过 渡 GHE, MA | 析 灰 度 剖 面 。 

黑 到 白 的 整个 过 渡 是 一 个 单一 的 边缘 ) 。 左 上 方 的 图 像 段 无 噪声 。 第 一 列 

中 的 其 他 三 幅 图 像 被 均值 为 零 、 标 准 差分 别 为 0.1, 1.0 和 10.0 个 灰 度 级 的 加 性 高 斯 噪声 污染 。 每 幅 图 像 下 
面 的 图 形 是 通过 图 像 中 心 的 水 平 灰 度 济 面 线 。 所 有 图 像 具 有 8 比特 的 灰 度 分 辩 率 ， 并 用 0 和 255 分 别 表示 
黑色 与 白色 。 

考虑 中 间 一 列 顶部 的 图 像 。 就 像 我 们 对 图 10.10(b) 的 讨论 那样 ， 左 侧 扫 描 线 的 导数 在 灰 度 恒定 区 域 为 
零 。 这 是 在 导数 图 像 中 显示 的 两 个 黑色 条 带 。 在 斜坡 上 的 各 点 处 的 导数 是 恒定 的 ， 并 等 于 斜坡 的 斜率 。 在 
导数 图 像 中 这 些 恒定 值 显示 为 灰色 。 当 我 们 沿 中 间 列 向 下 移动 时 ， 导 数 会 变 得 与 无 噪声 情形 时 越 来 越 不 相 
F KERE, 将 中 间 列 中 最 后 一 个 剖面 与 斜坡 边缘 的 一 阶 导数 联系 起 来 将 会 很 困难 。 造 成 这 种 有 意思 的 结 
果 的 原因 是 ， 左 列 图 像 中 的 噪声 几乎 不 可 见 。 这 些 例 子 很 好 地 说 明了 导数 对 噪声 的 敏感 性 。 

如 预想 的 那样 ， 二 阶 导数 对 于 噪声 甚至 更 为 敏感 。 无 噪声 图 像 的 二 阶 导 数 显示 在 右 列 的 上 部 。 白色 和 
黑色 的 细 垂 直线 是 二 阶 导 数 的 正 分 量 和 负 分 量 , 就 像 图 10.10 中 解释 的 那样 。 这 些 图 像 中 的 灰色 表示 零 ( 如 
先前 讨论 的 那样 ， 比 例 缩放 导致 零 显示 为 灰色 ) 。 唯 一 的 一 个 类 似 于 无 噪声 情况 的 有 噪声 二 阶 导数 图 像 对 
应 于 标准 差 为 0.1 的 噪声 。 另 两 幅 二 阶 导数 图 像 和 剖面 清楚 地 表明 了 检测 这 些 图 像 中 的 正 分 量 和 负 分 量 的 
确 很 困难 ， 而 这 些 分 量 在 边缘 检测 中 确实 是 非常 有 用 的 二 阶 导数 特性 。 

微弱 的 可 见 噪声 严重 影响 检测 边缘 所 用 的 两 个 关键 导数 这 一 事实 ， 是 我 们 应 记 住 的 一 个 重要 问 
题 。 特别 地 ， 在 类 似 于 我 们 刚刚 讨论 的 水 平 噪声 很 可 能 存在 的 应 用 中 ,使 用 导数 之 前 应 进行 图 像 的 平 


= © foo 








图 10.11 第 一 列 : 被 均值 为 委 、 标 准 差分 别 为 0.0,0.1,1.0 和 10.0 个 灰 度 级 的 随机 高 斯 噪声 所 污染 的 斜坡 边缘 的 
图 像 和 灰 度 剖面 。 第 二 列 : 一 阶 导 数 图 像 和 灰 度 剖面 线 。 第 三 列 : 二 阶 导 数 图 像 和 灰 度 剖面 线 


= 
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我 们 用 上 面 的 解释 给 出 执行 边缘 检测 的 三 个 基本 步 双 : 


1. 为 降 噪 对 图 像 进行 平滑 处 理 。 需 要 这 一 步 的 原因 已 由 图 10.11 的 第 二 列 和 第 三 列 中 的 结果 做 了 
详细 说 明 。 

2. 边缘 点 的 检测 。 如 先前 提 及 的 那样 ,这 是 一 个 局 部 操作 ， 从 一 幅 图 像 中 提取 所 有 的 点 ， 这 些 
点 是 变 为 边缘 点 的 潜在 候选 者 。 

3. 边缘 定位 。 这 一 步 的 目的 是 从 候选 边缘 点 中 选择 组 成 边缘 点 集合 的 真实 成 员 。 


本 节 剩 下 的 内 容 探讨 实现 这 些 目标 的 一 些 技术 。 

10.2.5 ”基本 边缘 检测 

如 前 一 节 说 明 的 那样 ， 为 了 达到 寻找 边缘 的 目的 ， 检 测 灰 度 变化 可 用 一 阶 或 二 阶 导数 来 完成 。 本 
节 讨 论 一 阶 导 数 ， 二 阶 导数 将 在 10.2.6 节 中 讨论 。 

图 像 梯 度 及 其 性 质 


为 了 在 一 幅 图 像 / 的 (x,y) 位 置 处 寻找 边缘 的 强度 和 方向 ,所 选择 的 
工具 就 是 梯度 ， 梯 度 用 V/ 来 表示 ， 并 用 向 量 来 定义 : 





Ff 

X | Sel) ee 
Vf =grad(f) = pi =| of (10.2-9) 

oy 

该 向 量 有 一 个 重要 的 几何 性 质 ， 即 指出 了 f 在 位 置 (x,y) 处 的 最 大 变化 率 的 方向 。 
向 量 Vf 的 大 小 (长 度 ) 表 示 为 M, y), B 

M(x, y)=mag(Vf)= Ve? +g; (10.2-10) 
它 是 梯度 向 量 方向 变化 率 的 值 。 注 意 ，g,, g, AMG, y) 都 是 与 原 图 像 大 小 相同 的 图 像 ， 是 x F y ES 
中 的 所 有 像素 位 置 上 变化 时 产生 的 。 实 践 中 ， 我 们 通常 称 后 一 图 像 为 梯度 图 像 ， 或 在 含义 很 清楚 时 人 简 


称 为 梯度 。 如 2.6.1 节 中 定义 的 那样 ， 求 和 、 平 方 和 开 方 操作 都 是 阵列 操作 。 
梯度 向 量 的 方向 由 下 列 对 于 x 轴 度量 的 角度 给 出 


a(x, y) =arctan el (10.2-11) 
Bx 


如 梯度 图 像 的 情况 那样 ，a(x,y) 也 是 与 由 g, PRO g, 的 阵列 创建 的 尺寸 相同 的 图 像 。 任意 点 (了 ) 处 一 
个 边缘 的 方向 与 该 点 处 梯度 向 量 的 方向 g(x,y) 正 交 。 







显 F 一 个 像素 ， 我 们 的 目的 是 得 到 用 

点 处 边缘 的 强度 和 方向 。 灰色 像素 的 值 为 0。 白色 像素 的 值 为 1。 下面 我 们 说 明 该 例子 。 
为 计算 x 方向 和 y 方 向 的 梯度 ， 该 方法 使 用 一 个 以 一 点 为 中 心 的 3x3 邻 域 ， 简 单 地 从 底部 一 行 的 像素 中 
减 去 顶部 一 行 邻 域 中 的 像素 ， 得 到 x 方 向 的 偏 导数 。 类 似 地 ， 我 们 从 右 列 的 像素 中 减 去 左 列 的 像素 得 到 
?方向 的 偏 导数 。 E RETR he Nese 2. 
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a(x, y) = arctan(g, /8, | 
同 。 图 10.12 (b) 显示 了 该 梯度 向 


|. mz 242 sey 图 像 坐标 系统 | 
ae EEA, | 




























































图 10.12 用 梯度 确定 某 个 点 处 的 边缘 强度 和 方向 。 注意 , 某 点 处 的 边缘 重 
直 于 该 点 处 的 梯度 向 量 的 方向 。 图 中 的 每 个 方块 表示 一 个 像素 


梯度 算 子 


要 得 到 一 幅 图 像 的 梯度 , 要求 在 图 像 的 每 个 像素 处 计算 偏 导数 0/16x 和 687/16y。 我 们 处 理 的 是 数 
字 量 ， 因 此 要 求 关 于 一 点 的 邻 域 上 的 偏 导 数 的 数字 近似 。 由 10.2.1 节 ， 我们 可 知 


Of (x, y) 


Bl, y)— f(x, y) (10.2-12) 
和 
8y= TERT y+1)- f(x, y) (10.2-13) 


这 两 个 公式 对 所 有 x 和 y 的 有 关 值 可 用 图 10.13 中 的 一 维 模 aP 
板 通过 对 f, 习 的 滤波 来 执行 。 

当 对 对 角 线 方向 的 边缘 感 兴 趣 时 ， 我 们 需要 一 个 二 维 模板 。 
罗伯特 交叉 梯度 算 子 (Roberts[1965]) 是 最 早 尝试 使 用 具有 对 角 优 
势 的 二 维 模板 之 一 。 考 虑 图 10.14 (a) 中 的 3x3 区 域 。 罗 伯 特 算 子 图 10.13 用 于 实现 式 (102-12) 和 





以 求 对 角 像素 之 差 为 基础 : 式 (10.2-13) 的 一 维 模板 
&x Reine =g) (10.2-14) 
Ox 
和 
0 
Sy =F =a) (10.2-15) 





这 些 导 数 可 以 使 用 图 10.14 (b) 和 (c) 中 的 模板 对 图 像 进行 滤波 来 实现 。 
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2x2 大 小 的 模板 在 概念 上 很 简单 ， 但 它们 对 于 用 关于 中 心 点 对 称 的 模板 来 计算 边缘 方向 不 是 很 有 

用 ， 其 最 小 模板 大 小 为 3x3。 这 些 模板 考虑 了 中 心 点 对 端 数据 的 性 质 ， 并 携带 有 关于 边缘 方向 的 更 
多 信息 。 用 大 小 为 3x3 的 模板 来 近似 偏 导数 的 最 简 数 字 近 似 由 下 式 给 出 : 

g, E eT ere a (10.2-16) 

ox 尽管 这 些 公式 包含 了 较 大 的 邻 域 ， 


和 但 我 们 仍 处 理 灰 度 值 间 的 差 ， 因 此 之 
前 讨论 一 阶 导数 时 得 到 的 结论 仍然 








图 10.14 一 幅 图 像 的 3x3 区 域 (z 项 是 灰 度 值 ) 和 用 于 计算 标记 点 z; 处 的 梯度 的 不 同 模板 


在 这 些 公 式 中 ，3x3 区 域 的 第 三 行 和 第 一 行 之 差 近 似 为 x 方向 的 导数 ， 第 三 列 和 第 一 列 之 差 近 似 
为 y 方 向 的 导数 。 直 观 上 ， 我们 可 以 预料 这 些 近 似 要 比 用 罗伯特 算 子 得 到 的 近似 更 准确 。 式 (10.2-16) 
和 式 (10.2-17) 可 用 图 10.14(d) 和 (e) 中 的 两 个 模板 通过 滤波 整个 图 像 来 实现 。 这 两 个 模板 称 为 Prewitt 算 
子 (Prewitt[1970]) 。 

这 两 个 公式 的 微小 变化 是 ， 在 中 心 系数 上 使 用 一 个 权 值 2: 


g. = Fa (2, 42a +25), + 22 +2) (10,2-18) 
x 
All 
of 
By agit Rahat tale Gat eat) (10.2-19) 


可 以 证 明 ， 在 中 心 位 置 处 使 用 2 可 以 平滑 图 像 (见习 题 10.10) 。 图 10.14(f A e) 显示 了 用 于 实现 
式 (10.2-18) 和 式 (10.2-19) 的 模板 。 这 些 模板 称 为 Sobel 算 子 (Sobel[1970]) 。 

Prewitt 模板 实现 起 来 比 Sobel 模板 更 为 简单 ， 但 它们 之 间 计 算 上 的 小 差别 并 不 是 问题 。 如 前 一 节 
提 到 的 那样 ,Sobel 模板 能 较 好 地 抑制 (平滑 ) 噪 声 的 特性 这 一 事实 使 得 它们 更 为 可 取 , 因为 在 处 理 导 数 
时 噪声 抑制 是 一 个 重要 的 问题 。 注 意 ， 图 10.14 中 所 有 模板 中 的 系数 之 和 为 零 ， 正 如 导数 算 子 所 预示 
的 那样 ， 恒 定 灰 度 区 域 的 响应 为 零 。 

刚才 讨论 的 模板 用 于 在 图 像 的 每 个 像素 位 置 处 得 到 梯度 分 量 g 和 g,。 然 后 ， 用 这 两 个 偏 导数 
估计 边缘 的 强度 和 方向 。 计 算 梯 度 的 幅度 时 ， 要 求 按 式 (10.2-10) 所 示 的 方法 联合 使 用 g& 和 gyo 但 
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这 种 实现 并 不 总 是 令 人 满意 ， 因 为 平方 和 平方 根 需要 大 量 的 计算 开销 。 经 常 使 用 的 一 种 方法 是 ,用 绝 


对 值 来 近似 梯度 的 幅 值 ; 
M(x, y)=|g,|+|g,| (10.2-20) 
该 式 不 仅 在 计算 上 更 有 吸引 力 ， 而 且 仍 保持 着 灰 度 级 的 相对 变化 。 为 这 一 优点 付出 的 代价 是 ， 滤 波 器 
- 般 将 不 再 是 各 回 同性 (旋转 不 变 ) 的 。 然 而 , 在 使 用 Prewitt 和 Sobel 这 样 的 模板 来 计算 g,. 和 g, 时 ,这 
并 不 是 问题 ， 因 为 这 些 模板 仅 对 垂直 和 水 平 边 缘 才 会 给 出 各 向 同性 的 结果 。 不 管 使 用 这 两 个 公式 中 的 
哪个 ,只 在 这 两 个 方向 上 的 边缘 ,结果 才 是 各 向 同性 的 ,此 外 ,使 用 Sobel 或 Prewitt 模板 时 , 式 (10.2-10) 
和 式 (10.2-20) 对 垂直 和 水 平 边 缘 给 出 相同 的 结果 (见习 题 10.8) 。 
可 以 修改 图 10.14 中 的 3x3 模板 ， 以 便 它们 沿 对 角 线 方向 有 最 大 的 响应 。 图 10.15 显示 了 另外 两 
个 用 于 检测 对 角 线 方向 边缘 的 Prewitt 和 Sobel 模板 。 


abcd | 
0 1 1 -1 1 | 0 0 I 2 -2 | -1 | 0 











P 0 l = 0 1 =1 0 1 =l 0 | 
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Prewitt Sobel 


到 10.15 检测 对 角 边 缘 的 Prewitt 和 Sobel 模板 





例 10.6 ”二 维 梯度 幅 值 和 角度 的 说 明 。 

图 10.16 说 明了 两 个 梯度 分 量 |g;| 和 |gs| 的 绝对 值 响 应 ,以 及 由 这 两 个 分 量 之 和 形成 的 梯度 图 像 。 梯 度 
的 水 平和 垂直 分 量 的 方向 性 在 图 10.16 (b) A (c) 中 很 明显 。 注 意 ， 图 10.16(b) 中 屋顶 的 瓦 片 、 砖 块 的 水 
平 接 颖 和 窗户 的 水 平 线段 比比 其 他 边缘 强 得 多 。 相 比 之 下 ， 图 10.16(c) 中 正面 和 窗户 的 垂直 分 量 更 强 。 
当 一 幅 图 像 涉 及 的 主要 特征 是 边缘 时 ， 如 梯度 幅度 图 像 ， 通 常 使 用 边缘 图 这 一 术语 。 在 图 10.16(a) 中 ， 
图 像 的 灰 度 被 标定 在 区 间 [0, 1] 内 。 在 本 节 讨 论 的 各 种 边缘 检测 方法 中 , 我 们 使 用 这 一 区 间 内 的 值 来 简化 
参数 的 选择 。 


abed 





图 10.16 (a) 灰 度 值 已 标定 为 范围 [0, 1] 内 的 、 大 小 为 834x1114 的 原 图 像 (b) ig], 
用 图 10.14 (中 的 Sobel 模板 滤波 图 像 得 到 的 x 方 向 上 的 梯度 分 量 ; (c) lgl, 
用 图 10.14(g) 中 的 模板 得 到 的 ?方向 上 的 梯度 分 量 ; (d) 梯度 图 像 lg,| + 加 | 


图 10.17 显示 了 使 用 式 (10.2-11) 计算 得 到 的 梯度 角度 图 像 。 通 常 ， 对 于 边缘 检测 而 言 ， 角 度 图 像 不 像 
幅度 图 像 那 样 有 用 ， 但 它们 可 以 作为 用 梯度 幅 值 从 图 像 中 提取 的 信息 的 补充 。 例 如 ， 图 10.16 (a) 中 的 
恒定 灰 度 区 域 ， 诸 如 斜 屋顶 的 前 边缘 和 前 墙 顶部 的 水 平 条 带 ， 在 图 10.17 中 都 是 恒定 的 ， 这 说 明 在 这 
些 区 域 中 的 所 有 像素 位 置 处 的 梯度 向 量 方向 是 相同 的 。 如 我 们 在 10.2.6 节 说 明 的 那样 ， 在 坎 尼 边缘 检 
测算 法 的 实现 中 ,角度 信息 起 着 重要 的 支撑 作用 ， 坎 尼 边 缘 检 测算 法 是 在 本 章 中 我 们 讨论 的 最 先进 的 
边缘 检测 方法 。 
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图 10.16 (a) 中 所 示 原 图 像 的 分 辩 率 相当 高 (834x1114 像 
素 ) ， 且 在 图 像 获 取 的 距离 上 ， 墙 砖 对 于 图 像 细 节 的 贡献 仍 
十 分 显著 ,这 种 精细 的 细节 在 边缘 检 测 中 通常 是 不 符合 需要 
的 , 因为 它 往往 表现 为 噪声 ,导数 计算 会 增强 这 种 噪声 , 从 
而 使 图 像 中 主要 边缘 的 检测 变 得 复杂 s 减少 精细 细节 的 一 
种 方法 是 对 图 像 进 行 平滑 处 理 。 图 10.18 显示 了 与 图 10.16 
中 相同 的 图 像 序 列 , 但 先 使 用 一 个 大 小 为 5x5 ei gts fit 
对 原 图 像 进行 了 平滑 (关于 平滑 滤波 器 ， 见 3.5 节 ) 。 现 在 每 
个 模板 的 响应 几乎 未 显示 出 由 砖 块 造成 的 影响 ， arn 图 10.17 使 用 式 (10.2-11) 计 算 的 梯度 角度 





几乎 都 是 主要 的 边缘 。 图 像 。 在 该 图 像 中 的 恒定 灰 度 区 
在 图 10.16 和 图 10.18 中 ,水 平和 垂直 Sobel 模板 不 区 分 域 指出 这 些 区 域 中 所 有 像素 位 

士 45" 方 向 的 边缘 是 很 明显 的 。 知 沿 对 角 方 向 强调 边缘 很 重 置 处 的 梯度 向 量 的 方向 均 相同 

要 , 则 应 使 用 图 10.15 中 所 示 的 一 个 模板 。 图 10.19(a) 和 (b) 

分 别 显 示 了 45° 和 一 45s 的 Sobel 模板 的 绝对 响应 。 在 这 些 图 中 ， 这 些 S a ROER | 


模板 的 较 强 对 角 响 应 很 明显 。 两 个 对 角 模 板 对 水 平 边缘 和 垂直 边缘 都 “| 会 随 着 平滑 模板 尺寸 的 增加 而 减 小 
Rig cia ` y AE O BER S arfi «u | (见习 题 10.13 

有 类 似 的 响应 ， 但 如 期 望 的 那样 ， 它 们 在 这 些 方向 上 的 响应 要 比 之 前 [ONO 

讨论 的 水 平和 垂直 模板 的 响应 弱 


| 


图 10.18 与 图 10.16 中 的 相同 图 像 序列 ， 但 在 边缘 检测 之 前 ， 用 大 小 为 5x5 的 均值 滤波 器 对 原 图 像 进行 了 平滑 





ab 





图 10.19 ”对 角 边 缘 检 测 : (a) 使 用 图 10.15 (c) 中 的 模板 得 到 的 结果 ; (b) 使 用 
图 10.15 (d) 中 的 模板 得 到 的 结果 。 两 种 情况 下 的 输入 图 像 都 是 图 10.18 (a) 
与 阔 值 处 理 相 结合 的 梯度 
图 10.18 中 的 结果 说 明 ， 在 计算 梯度 前 对 图 像 进行 平滑 处 理 ， 边 缘 检 测 可 做 更 多 的 选择 。 实 现 
相同 基本 目标 rae reh 对 梯度 图 像 进行 国 值 处 理 。 例 如 ， 图 10.20 (a) 显示 了 图 10.16 (d) A 
值 处 理 后 的 梯度 图 像 ， 此 时 其 值 大 于 等 于 梯度 图 像 的 最 大 值 的 33% | ”选择 用 于 生成 图 1020G9) 的 闽 值 的 ] 
的 像素 显示 为 白色 ， 而 低 于 该 阔 值 的 像素 则 显示 为 黑色 。 将 该 图 像 | 目的 , 是 是 消除 砖 块 导 致 的 多 数 较 小 边 | 


TES x J ee eee PTER. | 缘 。 回 忆 可 知 ， 这 是 在 计算 梯度 前 平 | 
与 图 10.18 (d) 进行 比较 ， 我 们 看 到 阔 值 处 理 后 的 图 像 中 边缘 更 少 ， EE 10.16 中 的 图 像 的 基本 目标 。 
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并 且 这 幅 图 像 中 的 边缘 要 清晰 得 多 (例如 ， 见 屋 瓦 中 的 边缘 ) . AA, TERE, 许 
多 边缘 〈 如 屋顶 边缘 的 4$" 线 ) 被 断 开 了 

当 目 的 是 突出 主要 边缘 并 尽 可 能 保持 连接 时 ， 实 践 中 通常 既 做 平滑 处 理 也 做 阔 值 处 理 
图 10.20 (b) 显示 了 图 10.18 (d) 经 阀 值 处 理 后 的 结果 , 它 是 平滑 后 图 像 的 梯度 。 结果 中 断 开 
明显 减少 ; 例如 ， 比 较 图 10.20(a) 和 (b) 中 的 4 边缘。 当然 ， 这 些 由 于 模糊 处 理 其 灰 度 值 严 ; 
降低 的 边缘 ( 即 屋 瓦 中 的 边缘 ) 可 能 因 阔 值 处 理 而 完全 消除 。 在 10.2.7 节 我 们 再 回来 i cane 
的 问题 


ab 

图 10.20 ” (a) 图 10.16(q) PERA ADS AR, PEDERE A UR Prey 33%; 
PANE EWA RAE AVR PIN Ree; (b) 图 10.18 (d) 中 图 
(REED FS EMR, EER rs LAY 33% AY Bd EU AY 


10.2.6 ”更 先进 的 边缘 检测 技术 





前 一 节 中 讨论 的 边缘 检测 方法 是 以 用 一 个 或 多 个 模板 对 图 像 进 行 滤波 为 基础 的 ， 而 未 对 图 像 特性 


和 噪声 内 容 采 取 预 防 措施 。 本 节 讨 论 更 为 先进 的 技术 ,例如 以 图 像 噪声 和 边缘 本 身 特性 为 基础 边缘 检 
测 方法 


Marr-Hildreth 边缘 检测 器 

Marr and Hildreth[1980] 最 早 成 功 尝试 了 在 边缘 检测 处 理 中 结合 更 [cop apace STRICT, | 
高 级 的 分 析 。 如 前 节 所 讨论 的 那样 ， 当 时 , 边缘 检测 方法 是 以 使 用 较 小 “| 可 以 考虑 图 10.8(@) 中 的 屋顶 边缘 .如 | 
的 算 子 为 基础 的 (如 Sobel 模板 ) Marr and Hildreth 证 明了 : (1) 灰 度 变 “| 果 图 像 的 尺寸 碱 小 ， 则 边缘 会 更 细 
化 与 图 像 尺 十 无 关 ， 因此 它们 的 检测 要 求 使 用 不 同 尺寸 的 算 子 ; (2) 灰 


度 的 突然 变化 会 在 一 阶 导 数 中 导致 波峰 或 波 谷 ， 或 在 二 阶 导 数 中 等 sae 交叉 (就 像 我 们 在 


图 10.10 中 见 到 的 那样 ) a RET 

这 些 概念 表明 ， 用 于 边缘 检测 的 算 子 应 有 两 个 明显 的 特点 。 第 一 “| R102 21) ARE 

| 的 定义 的 不 同 在 于 常数 项 2r oz | 

个 也 最 重要 的 特点 是 ， 它 应 该 是 一 个 能 计算 图 像 中 每 一 点 处 的 一 阶 时 | A mn A 

silyl. J Ake = dn php pens | 未 在 儿 个 给 定 1 个 | 

数 或 二 阶 导数 的 数字 近似 的 微分 算 子 。 第 二 ， 它 应 能 被 “调整 ”以 便 | 精确 的 表达 式 ， 则 乘 以 常数 可 添加 到 | 

在 任何 期 望 的 尺寸 上 起 作用 ， 因 此 大 算 子 也 可 用 于 检测 模糊 边缘 ， 小 | 式 040223 的 最 中。 | 
算 子 可 用 于 检测 锐 度 集中 的 精细 细节 


Marr and Hildreth 证 明 , 满足 这 些 条 件 的 最 令 人 满意 的 算 子 是 滤波 器 V2G ,如 在 3.6.2 节 中 定义 的 
那样 ，V? 是 拉 普 拉 斯 算 子 (62/16xr2 +0? /16y*) ,而 G 是 标准 差 为 o (有 时 o 也 称 为 空间 常数 ) 的 二 维 高 


y +y? 


G(x, y) =e 2° (10.2-21) 


T35 
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IR VG 的 表达 式 ， 我 们 执行 如 下 微分 : 

















V’G(x, y) os y) T ots a 2 = no hage 2o | 

3 ay“ OX | ao” oy |o 

RN (10.2-22) 
a es he) lipase aa 
ot o o ao 
整理 各 项 后 给 出 如 下 最 终 表达 式 : 
x y* 20 a 
V’G(x, y) ri o (10.2-23) 


该 表达 式 称 为 高 斯 拉 普 拉 斯 (LoG) 。 

图 10.21 (a) 到 (c) 显示 了 一 个 LoG MRR AEA, RRA Suet 
Pa eo ; kee oo em, 注意 图 10.21(c)' 8 am: JE 4.37(0) | 
面 (注意 LoG 的 零 交 义 出 现在 x +y = 20° 处 ， 它 定义 了 一 个 中 心 位 imeua man, 这 全，| 

于 原点 、 半 径 为 V2cr 的 圆 ) 。 因 为 图 10.21 (a) 中 显示 的 形状 ，LoG A | 我 们 可 期 望 LoG 的 作用 类 似 于 | 
ii y SFR HFT, A 10.21(d) 显示 了 一 个 5x5 模板 ， 它 i aed 

近似 于 图 10.21 (a) 中 的 形状 (在 实践 中 ， 我 们 会 用 该 模板 的 负 模板 ) 。 这 个 近似 并 不 是 唯一 的， 其 目的 
是 获取 LoG 涌 数 的 基本 形状 ; 根据 图 10.21 (a) ， 这 意味 着 一 个 正 的 中 心 项 由 紧邻 的 负 区 域 包围 ， 中 心 
项 的 值 以 距 原点 的 距离 为 函数 而 增 大 ， 而 外 层 区 域 的 值 为 零 。 系 数 之 和 必须 为 零 ， 因 此 模板 的 响应 在 
恒定 灰 度 区 域 为 零 。 





ons 
ar 












































“a N20 = 


图 10.21 (a) f LoG 的 三 维 图 ; (b) 显示 为 一 幅 图 像 的 负 LoG El; (c) 显示 了 零 交叉 的 图 
(a) 的 横 截 面 ; (d) 对 图 (a) 中 形状 5x5 模板 的 近似 ， 实 际 中 将 使 用 该 模板 的 负 值 





任意 尺寸 的 模板 都 可 通过 对 式 (10.2-23) 取样 并 标定 系数 以 使 系数 之 和 为 零 来 生成 。 生 成 LoG 滤波 
737 顺 的 一 种 更 有 效 的 方法 是 ， 以 希望 的 nxn 尺寸 对 式 (10.2-21) 取 样 ， 然 后 将 结果 阵列 与 一 个 拉 普 拉 斯 模 


第 10 章 BAR > 3) 461 


板 进行 卷 积 "， 例 如 图 10.4 (a) 中 的 模板 。 因 为 用 一 个 系数 之 和 为 零 的 模板 对 图 像 阵 列 卷 积 产生 一 个 元 


素 之 和 也 为 零 的 结果 (见习 题 3.16 和 习题 10.14) ， 故 这 种 方法 自动 满足 LoG 滤波 器 系数 之 和 为 零 的 要 
求 。 在 本 节 的 后 面 将 讨论 LoG 滤波 器 尺寸 的 选取 问题 。 

AAT V G 时 要 了 解 两 个 基本 概念 。 第 一 , 算 子 的 高 斯 部 分 会 模糊 图 像 ， 从 而 在 尺寸 上 将 结构 
的 灰 度 (包括 噪声 ) 降低 到 远 小 于 cz 的 程度 。 与 3.5 节 中 讨论 并 在 图 10.18 中 使 用 的 平均 形式 不 同 的 是 ， 
高 斯 函数 在 空间 和 频率 两 个 域 平滑 图 像 ( 见 4.8.3 节 ) , 因而 在 原 图 像 中 引入 不 存在 的 人 为 干扰 (如 振 铃 ) 
的 可 能 性 很 小 。 男 一 个 概念 涉及 V* ， 即 滤波 器 的 二 阶 导数 部 分 。 尽 管 一 阶 导数 可 用 于 检测 灰 度 突变 ， 
但 它们 是 有 方向 的 算 子 。 另 一 方面 ， 拉 普 拉 斯 有 各 向 同性 (旋转 不 变 ) 的 重要 优点 ， 这 不 仅 符合 人 的 视 
党 系统 特性 (Marr[1982]) ， 而 且 对 任何 模板 方向 的 灰 度 变化 有 相等 的 响应 ， 从 而 避免 了 使 用 多 个 模板 
去 计算 图 像 中 任何 点 处 的 最 强 响 应 。 

Marr-Hildreth 算法 由 LoG 滤波 器 与 一 幅 输入 图 像 fx,y) 卷 积 组 成 ， 即 

g(x, y)=[V’G(x, y)] X f(x, y) (10.2-24) 


然后 寻找 g(x, y) 的 零 交叉 来 确定 f(x, y) 中 边缘 的 位 置 。 因 为 这 些 都 是 线性 操作 ， 故 式 (10.2-24) 也 可 
写 为 


g(x, y) = V° [G(x y) f(x, y)] (10.2-25) 

它 指出 我 们 可 以 先 使 用 一 个 高 斯 滤波 器 平滑 图 像 ， 然 后 计算 该 结果 的 “| 沪 表 法 式 是 使 用 式 (342 在 空间 

拉 普 拉 斯 。 这 两 个 公式 给 出 了 相同 的 结果 。 城中 实现 的 。 也 可 使 用 趟 (47-D) 在 上 
Marr-Hildreth 边缘 检测 算法 可 小 结 如 下 : 率 域 中 实现 。 





1. 用 对 式 (10.2-21) 取样 得 到 的 一 个 nxn 高 斯 低 通 滤波 器 对 输入 图 像 滤 波 。 

2. 计算 由 第 一 步 得 到 的 图 像 的 拉 普 拉 斯 例如， 使 用 图 10.4 (a) 的 3x3 模板 [第 一 步 和 第 二 步 实现 
式 (10.2-25) |. 

3. 找到 步骤 2 所 得 图 像 的 零 交叉 。 


为 确定 高 斯 滤波 器 的 大 小 ， 仍 采用 位 于 二 维 高 斯 表面 下 其 均值 在 +3c 之 间 的 99.7%。 这 样 ， 作 为 
一 种 经 验 法 则 ， 大 小 为 nxn 的 LoG 离散 滤波 器 ， 其 n 值 应 是 大 于 等 于 6o 的 最 小 奇 整数 。n 小 于 该 值 
的 滤波 器 模板 会 “截断 ”LoG 函数 ， 截 断 的 程度 与 模板 的 大 小 成 反比 ; 而 使 用 较 大 的 模板 对 结果 的 影 
响 不 大 。 

在 滤波 后 的 图 像 g(x,y) 的 任意 像素 p Sh, 寻找 零 交 叉 的 一 种 方法 是 , 使 用 以 p 为 中 心 的 一 个 3x3 邻 域 。 
p 点 处 的 零 交叉 意味 着 至 少 有 两 个 相对 的 邻 域 像素 的 符号 不 同 。 有 4 种 要 测试 的 情况 : 左 / 右 、 上 /下 和 两 个 
对 角 。 如 果 g(x, ») 的 值 与 一 个 阔 值 比较 (一 种 常用 方法 ) ， 那 么 不 仅 相对 邻 域 的 符号 不 同 ， 而 且 它 们 的 
差 值 的 绝对 值 还 必须 超过 这 个 阔 值 -这 时 ,我 们 称 忆 为 一 个 零 交 叉 像 素 。 
下 面 的 例 10.7 中 将 说 明 这 一 方法 。 标 (区 来 找到 零 交叉 是 不 实际 的 , 因 

零 交 叉 是 Marr-Hildreth 边缘 检测 方法 的 关键 特征 。 前 段 中 讨论 的 “| 为 噪声 和 或 计算 不 准确 。 
方法 很 有 吸引 力 , 因为 它 实 现 简单 , 并 且 通 常 能 给 出 较 好 的 结果 。 如果 
在 某 个 特殊 应 用 中 使 用 这 一 方法 找到 的 零 交 叉 位 置 的 准确 性 不 够 ， 那 么 可 采用 由 Huertas and 
Medioni[1986] 提 出 的 采用 亚 像素 精度 来 寻找 零 交 叉 的 方法 。 


试图 通过 查找 满足 g(x, y) = 0 的 坐 ， 





D LoG 是 一 个 对 称 滤 波 器 ， 所 以 使 用 相关 或 卷 积 的 空间 滤波 将 产生 相同 的 结果 。 为 与 关于 这 一 主题 的 文献 保持 一 致 ， 这 里 我 们 使 
用 卷 积 这 一 术语 来 表示 线性 滤波 。 此 外 ， 也 为 读者 提前 了 解 这 一 术语 ， 因 为 在 其 他 内 容 中 也 会 遇 到 它 。 记 住 ，3.4.2 节 末 针对 这 
一 主题 给 出 的 注释 很 重要 。 ; 
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例 10.7 Marr-Hildreth 边缘 检测 算法 说 明 。 

图 10.22 (a) 显示 了 早先 使 用 过 的 建筑 物 图 像 , 图 10.22(b) 是 Marr-Hildreth 算法 的 步骤 1 和 步骤 2 得 到 
的 结果 ,其 中 o=4 ( 约 为 图 像 短 边 长 度 的 0.5%) Al n=25 (如 早先 讨论 的 那样 ,大 于 等 于 6c 的 最 小 奇 整数 ) 。 
如 在 图 10.5 中 那样 ， 这 幅 图 像 中 的 灰色 调 已 被 标定 -图 10.22 (c) 显示 了 使 用 上 面 讨论 过 的 闵 值 为 零 的 3x3 
邻 域 方法 得 到 的 零 交叉 。 注 意 ， 所 有 的 边缘 形成 了 一 个 闭环 。 这 种 所 谓 的 意大利 通 心 粉 效应 是 使 用 零 国 值 
方法 的 严重 缺点 (见习 题 10.15) 。 我 们 使 用 正 阔 值 避免 闭环 边缘 。 

图 10.22 (d) 显示 了 使 用 近似 等 于 LoG 图 像 最 大 值 的 4% 的 冰 值 的 结果 。 注意 ， 很 容易 地 检测 出 了 大 多 
数 的 主要 边缘 ， 并 且 滤 掩 了 一 些 “ 无 关 ” 特 征 ， 例 如 砖 块 和 屋 瓦 的 边缘 。 如 我 们 在 下 一 节 要 说 明 的 那样 ， 
使 用 前 节 讨 论 的 基于 梯度 的 边缘 检测 技术 实际 上 是 不 可 能 得 到 这 种 类 型 的 性 能 的 。 使 用 零 交 又 检测 边缘 的 
另 一 个 重要 结果 是 可 得 到 1 像素 宽 的 边缘 。 这 一 特性 简化 了 诸如 边缘 连接 的 后 续 阶 段 的 处 理 。 


ua BEE 


K 10.22 (a) 大 小 为 灰 度 值 已 标定 到 范围 [0, 1] 的 原 图 像 ;(b) Marr-Hildreth 算法 的 步 
又 1 和 步骤 2 得 到 的 结果 ， 其 中 o=4 和 n= 25; (ce) 使 用 零 准 值 的 图 (b) 的 零 交叉 (注意 闭 
环 边缘 ) ; (d) 使 用 等 于 图 (b) 中 图 像 的 最 大 值 的 4% 的 阔 值 时 ， 找 到 的 零 交 叉 。 注 意 细 边 缘 
考虑 到 早先 提 及 的 灰 度 变化 取决 于 数值 范围 的 事实 , 有 时 所 值 来 对 一 幅 图 像 进 
行 滤波 。 然 后 ， 所 得 零 交 义 边 缘 图 与 仅 为 全 部 图 形 保留 的 公共 边缘 相 结 合 。 这 种 方法 可 得 到 很 有 用 的 信 
息 , 但 由 于 其 复杂 性 ， 实 践 中 它 多 被 用 做 使 用 单一 渡 波 器 选择 合适 的 a 值 的 设计 工具 - 
Marr and Hildreth[1980] 指 出 ， 使 用 高 斯 差分 (DoG) 来 近似 式 (10.2-23) 中 的 LoG 滤波 器 是 可 能 的 : 


Ez +y? x+y 





2a? “ l 20} 





DoG(x, y) =—— e (10.2-26) 


2107 
式 中 o >o, 。 实 验 结果 表明 ， 在 人 的 视觉 系统 中 ， 某 些 “ 通 道 ” 就 方 
向 和 频率 而 论 是 有 选择 性 的 ， 且 可 以 使 用 式 (10.2-26) 以 1.75:1 的 标准 
差 比率 来 建 模 。Marr and Hildreth 建议 ， 使 用 1.6 :1 的 比率 不 仅 可 保持 一 
这 些 观察 的 基本 特性 ， 而 且 还 可 对 LoG 函数 提供 一 个 更 接近 的 “工程 ”近似 。 为 在 LoG 和 DoG 之 间 
进行 有 意义 的 比较 , 对 于 LoG，o 值 必须 按照 如 下 公式 选择 , 以 便 LoG 和 DoG 具有 相同 的 零 交 叉 ( 见 
习题 10.17) : 





和 Í 
高 斯 差分 是 个 高 通 滤波 器 ， 详 见 | 
4.7.4 dead | 






22 2 
o = Set) (10.2-27) 
O; = ony O3 
使 用 这 个 e 值 时 ， 尽 管 LoG 和 DoG WEZH, 但 它们 的 幅度 大 小 会 不 同 我 们 可 以 通过 标定 这 
两 个 函数 使 得 它们 兼容 ， 以 便 它 们 在 原点 处 有 相同 的 值 。 


图 10.23 (a) 和 (b) 中 的 剖面 线 是 分 别 使 用 标准 差 比率 1:1.75 和 1:1.6 产生 的 (按照 惯例 ,所 显示 的 曲 
线 被 反 转 ， 就 像 在 图 10.21 中 那样 ) LoG HMA BAR ASA, mM DoG 剂 面 线 显示 为 虚线 。 所 示 曲 线 
是 通过 LoG 和 DoG 阵列 中 心 的 灰 度 剖面 线 ， 这 两 个 阵列 分 别 是 通过 对 式 (10.2-23) (前 面 有 一 个 常数 
1/2xo?) 和 式 (10.2-26) 取样 产生 的 。 所 有 曲线 在 原点 处 的 幅度 均 被 归 一 化 为 1。 如 图 10.23 (b) 所 示 ， 
1:1.6 的 比率 在 LoG 和 DoG 函数 之 间 产 生 了 一 个 更 接近 的 近似 
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LoG 和 DoG 滤波 操作 均 可 直接 使 用 一 维 卷 积 代替 二 维 卷 积 来 实现 (见习 题 101.9) 。 对 于 一 幅 大 小 
为 MXN 的 图 像 和 一 个 大 小 为 nxn 的 滤波 器 ， 这 样 做 可 将 每 次 卷 积 所 需 的 乘法 和 加 法 次 数 ， 从 二 维 卷 
积 的 与 nMN 成 正比 , 减少 到 一 维 卷 积 的 与 n MN 成 正比 。 这 种 实现 上 的 差别 是 很 有 意义 的 。 例 如 ， 
若 2=25， 则 一 维 卷 积 实 现 的 乘法 与 加 法 操作 次 数 将 比 二 维 卷 积 实现 的 少 12 $F. 
ab 


图 10.23”(a) 用 比率 为 1.75 :1 的 标准 差 的 LOG( 实 线 ) 和 DOG (虚线 ) 
的 负 值 剖面 线 ， (b) 使 用 1.6 : 1 的 比率 得 到 的 剖面 线 


坎 尼 边缘 检测 器 


虽然 其 算法 更 为 复杂 , 但 本 节 讨 论 的 坎 尼 检测 器 (Canny[1968]) 是 迄今 为 止 讨论 过 的 边缘 检测 器 中 
最 为 优秀 的 。 坎 尼 方 法 基于 三 个 基本 目标 : 


1. 低 错 误 率 。 所 有 边缘 都 应 被 找到 ， 并 且 应 该 没有 伪 响 应 。 即 检测 到 的 边缘 必须 尽 可 能 是 真实 
的 边缘 。 

2. 边缘 点 应 被 很 好 地 定位 。 已 定位 边缘 必须 尽 可 能 接近 真实 边缘 。 即 由 检测 器 标记 为 边缘 的 点 
和 真实 边缘 的 中 心 之 间 的 距离 应 该 最 小 。 

3. 单一 的 边缘 点 响应 。 对 于 真实 的 边缘 点 ， 检 测 器 仅 应 返回 一 个 点 。 即 真实 边缘 周围 的 局 部 最 大 数 
应 该 是 最 小 的 。 这 意味 着 在 仅 存 一 个 单一 边缘 点 的 位 置 ， 检 测 器 不 应 指出 多 个 边缘 像素 。 


坎 尼 的 工作 的 本 质 是 ， 从 数学 上 表达 前 面 的 三 个 准则 ， 并 试图 找到 这 些 表达 式 的 最 佳 解 。 通 常 ， 
寻找 一 个 满足 前 述 目标 的 、 严 格 形式 的 解 是 很 困难 的 (或 不 可 能 的 ) 。 然 而 , | mia, EARL 
对 由 加 性 高 斯 白 噪声 污染 的 一 维 台阶 边缘 使 用 数字 最 佳 化 会 得 到 这 样 一 个 | 个 频谱 的 虹 声 ， 该 上 潜在 一 个 指定 的 


结论 ， 即 对 最 佳 台 阶 边 缘 检 测 器 的 一 个 较 好 近似 ?是 高 斯 一 阶 导 数 : | aera aommummeeene 









z fna BE; 高 斯 白 噪声 是 许多 真实 世界 情形 的 较 
ET ae (10.2-28) | 好 近似 ， 并 且 可 产生 数学 上 可 处 理 的 
dx o? 模型 。 高 斯 白 噪声 的 一 个 有 用 性 质 是 


把 该 结果 推广 到 二 维 情况 会 涉及 识别 一 维 方法 是 否 仍 适 用 于 边缘 法 | 其 人 是 统计 独立 的 。 
线 的 方向 ( 见 图 10.12) 。 因 为 预先 法 线 方向 未 知 ， 这 就 要 求 在 所 有 可 能 的 方向 上 应 用 一 维 边缘 检测 器 。 
这 一 任务 可 由 如 下 方法 来 近似 ; 首先 使 用 一 个 环形 二 维 高 斯 函数 平滑 图 像 ， 计 算 结果 的 梯度 ， 然 后 使 
用 梯度 幅度 和 方向 来 估计 每 一 点 处 的 边缘 强度 与 方向 。 

A> f(x,y) 表 示 输 入 图 像 ，G (x,y) 表 示 高 斯 函数 : 


xray 


G(x, y)=e 20 (10.2-29) 
我 们 用 G 和 了 的 卷 积 形成 一 幅 平 滑 后 的 图 像 f(x, y) : 
f(x, y)= G(x, y) * f(x, y) - (10.2-30) 


@ Canny[1986] 证 明 ， 使 用 高 斯 近似 与 使 用 最 优 数值 解 相 比 ， 所 得 结果 仅 差 约 20%。 这 种 幅度 差 在 多 数 应 用 中 通常 是 难以 察觉 的 。 
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像 10.2.5 节 讨论 的 那样 ， 这 一 操作 源 自 计算 梯度 幅度 和 方向 : 


M(x, y)= 8, +8; (10.2-31) 


a(x, y) = arctan] E | (10,2-32) 
HH, g,=Of,/Ox, g, =Of,/ Ay 。 图 10.14 中 的 任何 滤波 器 模板 对 都 可 用 来 得 到 g, Al g, 。 式 (10.2-30) 
是 使 用 大 小 为 nxn 的 高 斯 模板 实现 的 ， 其 大 小 将 在 下 面 讨论 。 记 住 ，M (x,y) Mal, y) 是 与 计算 出 它 
们 的 图 像 的 尺寸 相同 的 阵列 。 

因为 它 是 使 用 梯度 产生 的 , M(x, y) 在 局 部 最 大 值 周 围 通常 包含 更 宽 的 范围 (回忆 10.2.1 节 中 关于 
使 用 梯度 得 到 边缘 的 讨论 ) 。 下 一 步 是 细 化 那些 边缘 。 一 种 方法 是 使 用 非 最 大 抑制 。 这 可 通过 几 种 方式 
来 实现 ,但 该 方法 的 本 质 是 指定 边缘 法 线 的 许多 离散 方向 (梯度 向 量 )。 例 如 ， 在 一 个 3x3 区 域内 ， 对 
于 一 个 通过 该 区 域 中 心 点 的 边缘 ,我 们 可 以 定义 四 个 方向 2?: 水 平 、 垂 直 、+45°* 和 一 45°。 图 10.24 (a) 
显示 了 一 个 水 平 边缘 的 两 个 可 能 方向 。 因 为 我 们 必须 把 所 有 可 能 的 边缘 方向 量化 为 四 个 方向 ， 故 必须 
定义 一 个 方向 范围 ， 在 该 范围 内 ， 我 们 考虑 一 个 水 平方 向 的 边缘 。 我 们 由 边缘 法 线 的 方向 来 确定 边缘 
方向 ， 边 缘 法 线 方向 可 以 直接 使 用 式 (10.2-32) 从 图 像 数据 得 到 。 如 图 10.24 (b) 所 示 ， 知 边缘 法 线 方向 
的 范围 是 从 - 22.5$* 到 22.5°, 或 从 一 157.5° 到 157.3"， 则 我 们 称 该 边缘 为 水 平 边缘 。 图 10.24(c) 显示 了 
对 应 于 所 考虑 的 四 个 方向 的 角度 范围 。 


—157.5°\ c 






边缘 法 线 
边缘 (梯度 向 量 ) 





2 +225" 





图 10.24 (a) fE—*S 3x3 邻 域 中 ， 一 个 水 平 边缘 (灰色 ) 的 两 个 可 能 方向 ; (b) 一 个 水 平 边缘 
的 边缘 法 线 的 方向 角 的 值 的 范围 (灰色 ) ; (c) 在 一 个 3x3 邻 域 中 ，4 种 类 型 的 边 
缘 方向 的 边缘 法 线 的 角度 范围 。 每 个 边缘 方向 都 有 两 个 范围 ， 以 对 应 的 灰色 显示 


D 记 住 , 每 个 边缘 均 有 两 个 可 能 的 方向 。 例 如 ， 其 法 线 为 0 的 边缘 和 法 线 为 180° 的 边缘 是 同一 个 水 平 边缘 。 
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Sd d, ,d; 和 dd 表示 刚才 讨论 的 3x3 区 域 的 四 个 基本 边缘 方向 ; 水 平 、-45。、 垂 直 、+45s。 对 
于 Q(x,y) 中 以 每 点 Ce 为 中 心 的 3x3 区 域 ， 我 们 可 给 出 如 下 非 最 大 抑制 方案 : 


1， 寻找 最 接近 Q(x,y) 的 方向 4 o 

2. Æ M(x, y) 的 值 至 少 小 于 沿 di 的 两 个 邻居 之 一 ， 则 令 ey (x,y) =0 (抑制 ) ; 否则 , 令 gy (x,y) = 
M(x,y), XE g(x,y) 是 非 最 大 抑制 后 的 图 像 。 例 如 ， 参 考 图 10.24(a) , S, HE p, 4b, 并 
假设 一 个 水 平 边 缘 通过 p, , TEAR 2 中 我 们 感 兴趣 的 像素 是 p, 和 ps o ER gy (x, y) 仅 包 含 细 
化 后 的 边缘 ; 它 等 于 抑制 了 非 最 大 边缘 点 的 M (x,y) 。 


最 后 的 操作 是 对 gy(x,y) BETES, LAU Be. FE 10.2.5 节 中 ， Ri EAA RE 
行 国 值 处 理 ， 其 中 低 于 该 阔 值 的 所 有 值 均 置 为 零 。 若 我 们 设 的 冰 值 过 低 ， 则 仍 会 存在 一 些 伪 边 缘 ( 称 为 
伪 正 值 ) 。 若 阔 值 设 得 过 高 , 则 会 删除 实际 上 有 效 的 边缘 点 ( 伪 负 值 ) 。 如 我 们 在 10.3.6 节 中 讨论 的 那样 ， 
次 尼 算 法 通过 使 用 滞后 阔 值 试图 改进 这 一 状况 ， 它 使 用 两 个 国 值 : MRE T, 和 一 个 高 浆 值 Tv o 
钦 尼 建议 ， 高 阔 值 和 低 阔 值 的 比率 应 为 2 : 1 或 3 : 1。 

我 们 可 以 将 靖 值 操作 想象 为 创建 两 幅 附加 的 图 像 

Bi D= Ty (10.2-33) 
和 
Suz (% V)= By.) ST (10.2-34) 
其 中 ,开始 时 gwz(z7) 和 gw (x,y) SRA. EF, g yy (x,y) 的 非 零 像 素 通常 比 gy (x,y) 
少 , 但 gry (xy) 中 的 所 有 非 零 像素 都 将 包含 在 g(x,y) 中 ， 因 为 后 一 图 像 是 使 用 一 个 低 靖 值 形成 的 。 
通过 令 
ENL(X, Y) = Zn% Y)- Sun (% y) (10.2-35) 
我 们 从 gw (x,y) 中 删除 所 有 来 自 gwz (x,y) 的 非 零 像 素 。gwr V) Fl oy y) 中 的 非 零 像 素 可 分 别 视 
为 “ 强 ” 和 “ 弱 ” 边 缘 像素 。 

阔 值 处 理 后 ，gwr (x,y) 中 的 所 有 强 像素 均 被 假设 为 有 效 的 边缘 像素 , 并 被 立即 标记 。 PRF Ty 的 
(E, gny (2 切中 的 边缘 通常 会 存在 缝 阶 。 较 长 的 边缘 用 下 列 步 又 形成 : 

(a) 在 gwy(x;y») 中 定位 下 一 个 未 被 访问 的 边缘 像素 po 

(b) 在 gv (x.y) 中 将 所 有 弱 像 素 标 记 为 有 效 边缘 像素 ， 用 8 连通 的 连接 方法 连接 到 po 

(c) Æ gm (x,y) 中 的 所 有 非 零 像素 已 被 访问 ， 则 跳 到 步骤 (d) ， 否 则 返回 步 又 (a) 。 

(d) 将 gvz (x,y) 中 未 标记 为 有 效 边缘 像素 的 所 有 像素 置 零 。 


在 这 一 过 程 的 末尾 ， 将 来 自 gv(x,y) 的 所 有 非 零 像 素 附 加 到 gwz (x,y) ， 用 坎 尼 算 子 形成 最 终 的 
输出 图 像 。 

我 们 使 用 了 两 幅 附加 的 图 像 sw (x,y) 和 gz (x,y) 来 简化 讨论 。 在 实际 中 ， 湾 后 阐 值 处 理 可 在 非 
最 大 抑制 期 间 直 接 执 行 ， 并 且 可 以 通过 形成 一 个 与 它们 相 联 系 的 强 像 素 和 弱 像 素 的 列表 在 gy(x,y) 中 
直接 实现 。 

坎 尼 边缘 检测 算法 的 基本 步骤 总 结 如 下 : 


用 一 个 高 斯 滤波 器 平滑 输入 图 像 。 

计算 梯度 幅 值 图 像 和 角度 图 像 。 

对 梯度 幅 值 图 像 应 用 非 最 大 抑制 。 

用 双 阔 值 处 理 和 连接 分 析 来 检测 并 连接 边缘 。 


人 
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尽管 非 最 大 抑制 后 的 边缘 比 原来 的 梯度 边缘 细 ， 但 仍 保持 了 比 1 像素 粗 的 边缘 。 为 得 到 1 像素 粗 的 边 
缘 , 通常 要 在 步骤 4 后 执行 一 次 边缘 细 化 算法 ( 见 9.5.5 1) 。 

如 先前 提 到 的 那样 ,平滑 是 用 指定 的 大 小 为 nxn 的 高 斯 模板 与 输入 图 像 进行 卷 积 来 完成 的 
我 们 可 以 使 用 前 面 章节 讨论 过 的 : T Hildreth 算 法 有 关 的 方法 确定 n 值 ,即使 用 对 式 (10.2-29) 
取样 所 产生 的 一 个 滤波 器 模板 ,使 n 是 大 于 等 于 60 的 最 小 奇 整数 ， 进 而 提高 高 斯 滤波 需 的 “ 完 
美 ” 平 滑 能 力 。 若 实际 考虑 要 求 一 个 较 小 的 滤波 器 模板 ， 则 折 中 方案 是 较 小 n 值 的 平 ; HAURA 
差 一 些 

关于 实现 的 最 终 意见 如 下 : 如 先前 讨论 Marr-Hildreth 边缘 检 > 测 | nai IÑ (10.2-29) 中 的 二 维 高 斯 
函数 被 分 解 为 两 个 一 维 高 斯 函数 的 乘积 。 这 样 ， 坎 尼 算 法 的 步骤 1 就 可 用 一 维 卷 积 公式 来 表达 ， 即 一 
次 对 图 像 中 的 一 行 ( 列 ) 进行 操作 ,然后 再 对 处 理 结果 中 的 列 ( 行 ) 操 作 ee 如 果 使 用 式 (10.2-12) 
和 式 (10.2-13) 中 的 近似 ， 也 可 将 步 又 2 中 要 求 的 梯度 计算 以 一 维 卷 积 来 实现 (见习 题 10.20) 


$10.8 坎 尼 边缘 检测 方法 说 明 。 

图 10.25 (a) 显示 了 我 们 熟悉 的 建筑 物 图 像 。 为 了 比较 ， 图 10.25 (b) Fil (c) 分 别 显 示 了 先前 在 图 10.20 (b) 
中 用 效 值 化 后 的 梯度 得 到 的 结果 ， 以 及 在 图 10.22 (d) 中 使 用 Marr-Hildreth 检测 子 得 到 的 结果 。 回 忆 可 知 , 选 
取 生 成 这 两 幅 图 像 所 用 的 参数 来 检测 主要 边缘 ， 同 时 减少 “无 关 ” 特 征 ， 如 由 砖 块 和 屋 瓦 引起 的 边缘 。 

图 10.25 (d) 显示 了 用 坎 尼 算 法 得 到 的 结果 ， 使 用 的 参数 为 ，7T, =0.04, Ty = 0.10〈 低 阔 值 的 2.5 f), 

=4 ， 以 及 对 应 于 大 于 6o 的 最 小 奇 整数 的 、 大 小 为 25x25 的 模板 。 这 些 参 数 可 交互 式 地 选择 ， 以 达到 

前 面 章节 中 对 梯度 和 JMarr-Hildreth 图 像 扫 描 规 定 的 目标 .将 坎 尼 图 像 与 其 Ege REST RANAR 
他 两 幅 图 像 比较 , 我 们 看 到 主要 边缘 在 细节 上 已 有 明显 改进 , 同时 在 坎 尼 | 情形 下 a, Sem vi I-39 Hb Be 
结果 中 抑制 了 更 多 的 无 关 特性 。 例 如 , FEVERS ET AR | 个 标定 步骤 , 如 将 图 像 的 值 域 标定 为 
腻 在 墙 砖 中 间 的 水 泥 条 带 的 两 个 边缘 , 然而 , 阐 值 处 理 后 的 梯度 图 像 中 则 | taro, 1]。 从 这 一 Hir 子 可 以 看 出 ， 不 
消除 了 这 两 个 边缘 , 而 Marr Hildreth 图 像 中 仅 包 含 上 面 的 一 个 边缘 。 在 滤 Ce Por 
除 无 关 细 节 方 面 ， 坎 尼 图 像 确实 不 包含 由 屋 瓦 引起 的 单个 边缘 ; 在 其 他 两 一 一 一 一 
幅 图 像 中 却 不 是 这 样 。 在 坎 尼 图 像 中 ， 关 于 连续 性 、 细 度 和 笔直 度 等 线 的 质量 也 很 出 众 。 这 种 结果 使 得 坎 
尼 算 法 成 为 边缘 检测 的 首选 工具 。 


abed 





图 10.25 (a) 大 小 为 834x1114 像素 、 灰 度 值 标定 为 范围 [0, 1] 内 的 原 图 像 ;(b) 平 滑 过 的 图 像 
经 国 值 处 理 后 得 到 的 梯度 图 像 ，(c) 使 用 Marr-Hildreth 算法 得 到 的 图 像 ; (d) 使 用 
坎 尼 算法 得 到 的 图 像 。 注 意 ， 与 其 他 两 幅 图 像 相 比 ， 坎 尼 图 像 有 明显 的 改进 


例 10.9 本 节 中 讨论 的 三 种 主要 边缘 检测 方法 的 另 一 说 明 。 
作为 本 节 中 讨论 的 三 种 主要 边缘 检测 方法 的 另 一 比较 , 考虑 图 10.26(a) , 它 显 示 了 一 幅 大 小 为 512x512 
的 头 部 CT 图 像 。 在 这 个 例子 中 , 我们 的 目的 是 提取 大 脑 外 轮廓 (PRB IR CS aR). AMIE CHE HB ANS 
部 外 轮廓 的 边缘 。 在 消除 眼 部 和 大 脑 区 域 中 与 灰色 有 关 的 边缘 细节 时 ,我 们 希望 生成 尽 可 能 最 细 且 连续 的 
5 到” 轮廓。 
J46 图 10.26(b) 显示 了 一 幅 阔 值 处 理 后 的 梯度 图 像 ， 它 已 先 用 一 个 5x5 均值 滤波 器 平滑 过 。 达 到 所 示 结 果 
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2K RIZE ABM ROCA 15%.) 10.26 (c) 显示 了 使 用 Marr-Hildreth 边缘 检测 算法 得 到 的 结果 ， 
所 用 的 闵 值 为 0.002，o =3 ,模板 大 小 为 19x19 像素 ,图 10.26(d) 是 使 用 坎 尼 算 法 得 到 的 ,所 用 的 7 =0.05， 
T, =0.15 (RUA 3 倍 ) ，o=2 ,模板 大 小 为 13x13， 像 Marr-Hildreth 情况 那样 ， 它 对 应 于 大 于 6cr 的 
最 小 奇 整数 

在 边缘 质量 及 消除 无 关 细 节 的 能 力 方面 ， 图 10.26 中 的 结果 相当 接近 前 一 例子 中 的 结果 与 结论 。 还 要 注 
所， 欣 尼 算法 是 唯一 能 为 大 脑 后 边界 产生 完整 无 断裂 边缘 的 过 程 ， 也 是 在 消除 原始 图 像 中 与 灰 度 物质 有 关 
的 所 有 边缘 时 ， 有 可 能 发 现 最 好 轮廓 的 过 程 。 





abcd 





图 10.26 (a) 大 小 为 512x512 像素 、 灰 度 值 已 标定 到 范围 [0, 1] 内 的 原始 头 部 CT AUR; (b) 平 
滑 后 的 图 像 经 阔 值 处 理 后 的 梯度 图 像 ; (c) 用 Marr-Hildreth 算法 得 到 的 图 像 ; 
(d) 用 坎 尼 算法 得 到 的 图 像 ( 原 图 像 由 Vanderbilt 大 学 的 David R. Pickens 博士 提供 ) 


正 像 预期 的 那样 ， 坎 尼 算 法 改进 性 能 所 付出 的 代价 是 ， 它 要 比 早 些 时 候 讨论 的 两 种 方法 实现 起 来 
更 复杂 ， 同 时 执行 时 间 更 长 。 在 某 些 应 用 中 ， 如 实时 工业 图 像 处 理 ， 成 本 和 速度 需求 通常 要 求 我 们 使 
weft agg 主要 是 阔 值 梯度 方法 。 当 关注 的 主要 是 边缘 质量 时 ， 通 常会 使 用 Marr-Hildreth 算法 
和 坎 尼 算法 ， 特 别 是 坎 尼 算法 。 


10.2.7 ”边缘 连接 和 边界 检测 


理想 情况 下 ， 边 缘 检 测 应 该 仅 产生 位 于 边缘 . 上 的 像素 集合 实际 上 ， 由 于 噪声 、 不 均 勺 照明 
引起 的 边缘 间断 ， 以 及 其 他 引入 灰 度 值 虚假 的 不 连续 的 影响 ,这 些 像 素 并 不 能 完全 描述 边缘 特性 
因此 ， 一 般 是 在 边缘 检测 后 紧 跟 连接 算法 ， 将 边缘 像素 组 合成 有 意义 的 边缘 或 区 域 边界 。 本 节 讨 
论 2 它们 是 实际 中 使 用 的 代表 性 技术 。 第 一 种 方法 需要 有 关 局 部 区 域 中 
边缘 点 (如 一 个 3x3 邻 域 ) 的 知识 ; 第 二 种 方法 要 求 区 域 边界 上 的 点 已 知 ; 第 三 种 技术 是 处 理 整个 
边缘 图 像 的 全 aon 


局 部 处 理 
连接 边缘 点 最 简单 的 方法 之 一 是 ， 在 每 个 点 (x,») 处 的 一 个 小 邻 域内 分 析 像 素 的 特点 ， 该 点 是 用 前 


入 讨论 过 的 技术 之 声明 的 边缘 点 。 根据 预定 的 准则 ， 将 所 有 的 相似 点 连接 起 来 ， 以 形成 根据 指定 准 
则 满足 E ty 站 性 像素 的 一 条 边缘 
这 种 类 型 的 分 析 中 ， 用 于 确定 边缘 像素 相似 性 的 两 个 主要 性 质 是 : (1) 梯度 向 量 的 强度 (幅度 ) ; 
eee 向量 的 方向 。 第 一 个 性 质 基 于 式 (10.2-10) 。 令 8， 表示 一 由 图 像 中 以 点 Qe 为 中 心 的 -个 邻 域 
的 坐标 集合 。 如 果 
|M(s,t)-M(x, y)| SE (10.2-36) 
AF, E 是 一 个 正 立 值 
梯度 向 量 的 方向 角 由 式 (10.2-11) 给 出 。 如 果 
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la(s, t)—a(x, y)| <A (10.2-37) 


SUP, 4 是 一 个 正 角度 阔 值 ， 则 Su 中 坐标 (s, 9 处 的 一 个 边缘 像素 有 一 个 与 ») 处 像素 类 似 的 角度 。 如 
10.2.5 节 中 注释 的 那样 ，(x, y) 处 的 边缘 的 方向 垂直 于 该 点 处 梯度 向 量 的 方向 。 

如 果 既 满足 幅度 准则 , 也 满足 方向 准则 ; 则 S。 中 , 坐标 为 (s, 的 像素 被 连接 到 坐标 为 (x, y) 的 像素 。 
在 图 像 中 的 每 个 位 置 重复 这 一 处 理 。 当 邻 域 的 中 心 从 一 个 像素 移 到 另 一 个 像素 时 ， 必 须 将 已 连接 的 点 
记录 下 来 。 简 单 的 记录 过 程 是 对 每 组 被 连接 的 像素 分 配 不 同 的 灰 度 值 。 

前 面 的 公式 计算 代价 很 高 ， 因 为 必须 检验 每 个 点 的 所 有 邻 点 。 一 种 特别 适合 于 实时 应 用 的 简化 由 
如 下 步骤 组 成 : 


1. 计算 输入 图 像 A(x;y) 的 梯度 幅度 阵列 M (x, y) 和 梯度 角度 阵列 w(x,7) o 
2. 形成 一 幅 二 值 图 像 g， 任 何 坐标 对 Ge y) 处 的 值 由 下 式 给 出 : 


M(x, y) > Ty Ha(x, y)= A+T, 


ib 
se 其 他 


AP, Ty 是 一 个 阔 值 , 4 是 一 个 指定 的 角度 方向 ，+7, 定义 了 一 个 关于 4 的 可 接受 方向 “带宽 "。， 
3. 扫描 &g 的 行 ,并 在 不 超过 指定 长 度 天 的 每 一 行 中 填充 ( 置 1) 所 有 缝 际 (0 的 集合 ) 。 注意 ,按照 ， 
定义 ,缝隙 一 定 要 限制 在 一 个 1 或 多 个 1 的 两 端 。 分 别处 理 各 行 ， 它 们 之 间 没 有 记忆 。 
4. 在 任何 其 他 方向 6 上 检测 缝隙 ， 以 该 角度 旋转 g8， 并 应 用 步骤 3 中 的 水 平 扫描 过 程 。 然 后 ， 将 
结果 以 -9 旋转 回来 。 


当 目 的 在 于 水 平 边缘 连接 和 垂直 边缘 连接 时 ， 步 4 就 变 为 一 个 简单 的 过 程 ， 在 该 过 程 中 ，g 被 | 
旋转 90"， 扫 描 各 行 后 ， 结 果 再 被 旋转 回来 。 这 是 实践 中 最 常用 的 方法 ， 如 下 例 所 示 ， 这 种 方法 可 以 


产生 很 好 的 结果 。 通 常 ， 图 像 旋 转 是 代价 很 高 的 计算 处 理 ， 因 此 ， 在 要 求 多 角度 方向 上 的 连接 时 , 把 ， 
步骤 3 和 步骤 4 组 合成 单个 放射 状 扫描 过 程 更 为 实用 。 





通常 ， 图 像 中 感 兴趣 区 域 的 位 置 已 知 或 可 以 确定 。 这 意味 着 在 相应 的 边缘 图 像 中 关于 像素 的 区 
域 成 员 的 知识 是 可 用 的 。 在 这 种 情况 下 ， 我 们 可 以 使 用 在 区 域 的 基础 上 连接 像素 的 技术 ， 所 期 望 的 ， 
结果 是 该 区 域 边界 的 近似 。 对 这 类 处 理 的 一 种 方法 是 函数 近似 ， 这里， 我 们 对 已 知 点 拟 合 一 条 二 维 
曲线 。 我 们 的 兴趣 通常 在 于 快速 执行 的 技术 , 它 可 对 边界 的 基本 特性 产生 一 个 近似 , 例如 端点 和 四 点 。， 
za 多 边 形 近似 尤其 有 吸引 力 ， 因 为 在 保持 边界 表示 (如 多 边 形 的 顶点 ) 相对 简单 的 情况 下 ， 它 们 可 以 捕 提 
PE) 基本 形状 特性 。 本 节 阑 述 和 说 明 一 种 适合 这 一 目的 算法 。 
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图 10.27 ” (a) 一 幅 大 小 为 534x566 的 汽车 后 部 图 像 ; (b) 梯度 幅度 图 像 ; 〈c) 水 平 连接 


的 边缘 像素 ; (O 垂直 连接 的 边缘 像素 ; (e) 前 两 幅 图 像 的 逻 轩 


“或” (OR) 


(用 形态 学 细 化 得 到 的 最 终结 果 ( 原 图 像 由 Perceptics Corporation 提供 ) 


在 说 明 该 算法 之 前 , 我 们 用 一 个 简单 的 例子 来 讨论 该 过 程 的 机 理 。 图 1 


0.28 显示 了 表示 一 条 非 闭 


合 曲 线 点 的 集合 ， 其 中 端点 标记 为 4 和 8。 按照 定义 ， 这 两 个 点 是 多 边 形 的 顶点 。 首 先 ， 我 们 计算 
通过 4 点 和 号 点 的 一 条 直线 的 参数 。 然 后 ， 计 算 曲 线 上 所 有 其 他 点 到 这 条 


产业 


为 


最 大 距离 的 点 (目的 是 解决 任意 性 ) 。 若 该 距离 超过 了 指定 的 阔 值 7， 
-个 顶点 ， 如 图 10.28(c) 所 示 。 然后, 建立 从 4 到 C 和 从 C 到 8B 的 直线 ， 


直线 的 垂直 距离 ， 并 选择 
则 将 标 为 C 的 相应 点 宣布 
得 到 从 4 至 C 间 的 所 有 


点 到 线 4C 的 距离 。 如 果 距 离 超过 了 7， 相应 于 最 大 距离 的 点 被 宣布 为 一 个 顶点 D; 否则 ， 对 于 该 线 


役 就 没有 新 的 顶点 要 宣布 。 类 似 的 过 程 用 于 C 和 B 之 间 的 点 。 图 10.28 (b) 显示 了 结果 ， 图 10.28 (c) 
显示 了 下 一 步 的 结果 。 继 续 这 一 迭代 过 程 ， 直 到 没有 点 满足 立 值 测试 为 止 。 图 10.28(d) 显示 了 最 终 的 结 
果 ， 如 我 们 看 到 的 那样 ， 该 结果 是 拟 合 给 定点 的 曲线 形状 的 一 种 合理 近似 

ab C mLa 

cad ‘ P 





图 10.28 ”多边形 拟 合算 法 迭代 说 明 
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刚才 解释 的 过 程 中 隐 含 了 两 个 重要 的 需求 。 首 先 ， 必 须 指定 两 个 起 始点 ; 其 次 ， 所 有 点 都 必须 排 
A E E ee Une 
情况 ) , 这 并 不 总 是 很 明显 ,无 论 是 点 属于 边界 线段 (开放 曲线 ) ， 还 是 属于 一 条 边界 (闭合 曲线 ) 。 
ET 
些 点 的 序列 时 ， 相 对 于 其 他 点 的 距离 的 两 个 连续 点 间 较 大 的 距离 是 开放 曲线 的 较 好 指示 。 然 后 使 用 端 
点 开始 该 过 程 。 如 果 点 间 的 分 离 趋 于 均匀 ， 那 么 我 们 很 可 能 处 理 的 是 一 条 闭合 曲线 。 在 这 种 情况 下 ， 
对 于 选取 两 个 起 始点 我 们 有 几 种 选择 。 一 种 方法 是 选择 点 集中 最 右边 的 点 和 最 左边 的 点 。 另 一 种 方法 
是 寻找 曲线 的 极端 点 (11.2.1 节 中 讨论 了 一 种 这 样 的 方法 ) 。 寻 找 一 个 多 边 形 拟 合 开放 和 闭合 曲线 的 算 
1. 令 P 是 一 个 已 排序 序列 ， 显然， 这 些 点 是 一 幅 二 值 图 像 中 的 1 | 。 关于 创建 已 排序 点 序列 的 算法 , 见 
值 点 。 指定 两 个 起 始点 4 MB. 它们 是 多 边 形 的 两 个 起 始 顶点 。 UEP 

2. 指定 一 个 浆 值 Z， 以 及 两 个 空 堆栈 “ 开 ” (OPEN) 和 “ 闭 ”(CLOSED) 。 

3. 车 也 中 的 点 对 应 于 一 条 闭合 曲线 ， 则 把 4 放 到 “ 开 ” 中 ， 并 把 B 放 到 “ 开 ” 和 “ 闭 ” 中 。 
若 点 对 应 于 一 条 开放 曲线 , 则 把 4 放 到 “ 开 ” 中 ,而 把 8 放 





为 堆栈 名 称 使 用 的 OPEN 和 


到 “ 闭 ” 中 。 CLOSED 与 非 闭合 曲线 和 闭合 曲线 

4. 计算 从 “ 闭 ” 中 最 后 一 个 顶点 到 “ 开 ” 中 最 后 一 个 顶点 的 线 的 无 关 。 堆栈 名 称 仅 指出 一 个 存储 最 终 

参数 。 (CLOSED) 顶 点 或 过 渡 期 间 (OPEN) 的 
顶点 的 堆栈 。 





5. 计算 步骤 4 所 得 的 直线 至 P 中 所 有 点 的 距离 ， 序列 把 它们 放 到 
此 又 4 所 得 的 两 个 顶点 之 间 。 选 择 具有 最 大 距离 Du 的 点 Vina (解决 任意 性 问题 ) 。 

-Dox >T ， 则 把 ,作为 一 个 新 顶点 放 在 “ 开 ” 的 末尾 。 转 到 步骤 4。 

. 否则， 从 “ 开 ” 中 移 除 最 后 一 个 顶点 ， 并 把 它 作为 “ 闭 ”的 最 后 一 个 顶点 插入 。 

. 若 “ 开 ” 非 空 ， 转 到 步骤 4。 

否则 ， 退 出 。“ 闭 ”中 的 顶点 就 是 拟 合 P 中 的 点 的 多 边 形 的 顶点 。 


下 面 的 两 个 例子 说 明了 该 算法 的 机 理 。 


— $110.11 用 多 边 形 近似 连接 边缘 。 
考虑 图 10.29(a) 中 的 设 这 些 点 属于 一 条 闭合 则 线 ， 和 它们 已 按 顺 时 针 方 向 排序 (注意 有 些 点 
HIRED, ARII :的 最 左 侧 点 和 最 右 侧 点 。 这 些 是 起 始 顶点 ， 如 表 10.1 所 示 。 选 取 序列 
中 的 第 一 个 点 作为 最 左 侧 的 点 4 图 10.29(b) 仅 显示 了 4 和 有 间 线 段 上 方 的 点 ( 标 为 O, 该 点 满足 算法 的 
步骤 6， 因 此 将 它 指定 为 一 个 新 项 点， 并 将 它 添加 到 “ 开 ” 堆 栈 内 的 顶点 中 。 表 10.1 的 第 二 行 显示 了 被 检 
测 的 C， 第 三 行 表明 它 它 作为 最 后 一 个 顶 上 FE” 中。 图 1029(b) 中 的 六 值 了 约 等 于 网 格 图 中 的 一 
wR 
eS, ,在 图 10.29(b) sh, 直线 AB FAP, 该 点 也 清和 又 es i, BEM, 
故 一 次 只 能 检测 这 两 个 项 点 间 的 点 的 一 个 子 集 。 该 用 T 方 的 其 他 点 将 在 后 检测 ， 如 图 1029 人 Pir 
关键 是 总 要 按 给 出 的 顺序 来 追踪 这 些 点 。 tes 
K 10.1 说 明了 导致 图 10.29 (h) 中 的 解 的 各 个 步 又 。 图 中 检测 到 了 4 个 顶点 ， 并 且 该 图 用 让 线段 连 接 这 
4 个 顶点 形成 了 一 个 近似 给 定 边界 点 的 多 边 形 。 注 意 ， 尽 管 是 按 顺 时 针 方向 追踪 这 些 点 而 生成 的 硕 点， 但 
表 中 检测 到 顶点 B, C, A, D, B 是 按 逆 时 针 方向 的 。 车 输入 是 一 条 开放 曲线 ， 那 么 顶点 将 是 顺 时 针 顺序 的 。 
导致 这 种 差异 的 原因 是 初始 化 “ 开 ” 和 “ 闭 ” 堆 栈 的 方法 。 对 开放 和 闭合 曲线 形成 的 堆栈 “ 闭 ”的 差别 ， 
LEARN ERA TE ATUNA MEN, 这 与 给 由 顶点 如 何 来 区 分 开放 和 闭合 多 过 形 是 
一 致 的 。 


DO con a 
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图 10.29 ” (a) 一 条 顺 时 针 路 径 中 的 点 集 ( 标 为 4 和 B 的 点 被 迁 为 起 始 硕 点); (b) C 
到 过 4 和 B 的 直线 的 距离 是 4 和 8B 间 所 有 点 中 最 大 的 ， H T E 
测试 , 因此 C 是 一 个 新 顶点 ; (d)~(g) 算 法 的 各 个 进程 ; (h) 用 直线 连接 
形成 一 个 多 边 形 所 显示 的 最 后 的 顶点 。 表 10.1 说 明了 一 步 步 的 细节 


表 10.1 例 10.11 机 理 的 详细 步骤 





例 10.12 “一 幅 图 像 的 边界 的 多 边 形 拟 合 。 

图 10.30 显示 了 多 边 形 拟 合 的 一 个 更 为 实际 的 例子 。 图 10.30 (a) 中 的 输入 图 像 是 大 小 为 550x566 
的 人 政和 射线 图 像 ， 其 灰 度 已 标定 到 区 间 [0, 1]。 该 例 的 目的 是 提取 牙齿 的 边界 。 图 10.30(b) 是 使 用 
Soble HRIBE T= 0.1( 最 大 灰 度 的 10%) 得 到 的 梯度 图 像 。 如 预期 的 那样 ， X 射线 图 像 中 的 噪声 成 
分 很 高 ， 因 此 ， 第 一 步 是 降 噪 。 因 为 该 图 像 是 二 值 图 像 ， 故 形态 学 技术 可 很 好 地 适用 于 这 一 目 的 。 
图 10.30(c) 显示 了 滤 除 大 多 数 噪声 后 的 结果 , 若 在 3x3 邻 域内 有 5 个 或 更 多 个 像素 为 1， 则 置 像素 为 
1， 否 则 置 像素 为 0。 虽 然 噪 声 已 减少 ， 但 某 些 噪声 点 仍 清晰 可 见 。 图 10.30(d) 显示 了 形态 学 收缩 后 
的 结果 , 它 进一步 将 噪声 降低 为 孤立 的 点 。 这 些 噪声 是 用 例 9.4 中 描述 的 方式 使 用 形态 学 滤波 消除 的 
[WE 10.30(e) |. 在 这 一 点 上 ， 图像 由 粗 边 界 组 成 ， 这 些 六 界 可 通过 形态 学 骨架 方法 来 加 以 细 化 ， 
如 图 10. 30( 昌 所 示 。 最 后 ， 图 10.30(g) 显示 了 天 处 理 中 最 后 - 步 去 除 和 机 后 的 结果 如 9.5.8 节 讨论 
的 那样 。 J 

接着 , 我 们 用 一 “多 边 形 来 /全 图 1030(g) sri, 图 103000)~ 外 显示 了 用 多 边 形 拟 合算 法 的 结果 ， 
其 中 国 值 分 别 等 于 图 宽度 的 0.5%， RIAD, T=3,6 和 12) 。 前 两 个 结果 较 好 地 近似 了 边界 ， 但 第 三 
个 处 在 临界 状态 。 所 有 这 三 种 情况 中 ， 过 度 的 锯齿 清楚 地 表明 需要 进行 边界 平滑 。 图 10.30(k) 和 (D 显示 了 
一 个 一 维 均 值 模板 分 别 与 图 全 和 图 (h) 中 的 边界 卷 积 后 的 结果 所 用 的 模板 是 元 素 为 1 的 1x31 阵列 ， 约 为 
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ne ail 5%。 如 所 期 望 的 那样 , 图 10.30 (k) 中 的 结果 在 保护 重要 形状 特征 方面 仍 是 临界 的 ( 即 右 侧 
2 。 男 一 方面 , 图 10.30 (0) 中 的 结果 显示 了 有 效 的 边界 平滑 ， 合 理 保 留 了 形状 特征 。 例 如 ， 图 像 以 
合理 的 保 真 度 保留 了 左上 方 尖 点 的 圆 度 和 右上 方 尖 点 的 细节 。 





图 10.30”(a) 一 幅 大 小 为 550x566 像素 的 人 的 牙齿 图 像 ;(b) 梯度 图 像 ; 〈c) 滤 除 大 多 数 品 
声 的 结果 ; (d) 形态 学 收缩 的 结果 ; (e) 形 态 学 清除 的 结果 ; (D 骨架 ; (g) 去 除 
毛刺 ; (h) ~(j) on Mitra cx HY 0.5%, 1% All 2% (ERI T= 3, 6 Fil 12) HWA 
边 形 拟 合 ; (k) 使 用 一 1x31 ( 约 为 图 像 宽度 的 5%) 的 一 维 均值 滤波 器 
平滑 图 4) 中 oi te 1) 使 用 相同 滤波 器 平滑 图 \h) 中 边界 后 的 结果 


上 例 中 的 结果 是 使 用 本 节 讨 论 的 多 边 形 拟 合算 法 所 能 得 到 的 典型 结果 。 该 算法 的 优点 是 ， 实 现 简 
单 ， 且 产生 的 结果 通常 是 可 以 接受 的 。11.1.3 节 将 讨论 一 种 更 完善 的 过 程 ， 即 通过 计算 最 小 周 长 多 边 
形 可 产生 更 接近 的 拟 合 


使 用 霍 夫 变换 的 全 局 处 理 

前 两 节 中 讨论 的 方法 可 用 于 这 样 的 场合 ， 即 属于 各 个 目标 的 像素 的 知识 部 分 可 用 。 例 如 ， 在 区 域 
处 理 中 , 只 有 当 我 们 知道 它们 是 一 个 有 意义 区 域 边界 的 一 部 分 时 , 连接 给 定 的 像素 集 才 有 意义 。 通 常 ， 
我 们 不 得 不 工作 在 无 结构 的 环境 中 ， 这 时 我 们 拥有 的 只 是 一 幅 边 缘 图 像 ， 而 没有 感 兴趣 目标 可 能 在 哪 
里 的 知识 。 在 这 种 情况 下 ， 所 有 像素 都 是 连接 的 候选 点 ， 因 此 必须 基于 预先 定义 的 全 局 性 质 接受 或 删 
除 某 些 点 。 本 节 介 绍 一 种 基于 像素 集 是 否 位 于 指定 形状 的 曲线 上 的 方法 。 一 旦 检测 到 ， 这 些 曲线 就 会 
形成 边缘 或 感 兴趣 的 区 域 边界 。 

给 定 一 幅 图 像 中 的 个 点 ,假设 我 们 希望 找到 这 些 点 中 一 个 位 于 直线 上 的 子 集 。 一 种 可 行 的 解决 
方法 是 ， 先 找到 所 有 由 每 对 点 确定 的 直线 ， 然 后 寻找 靠近 特定 直线 的 点 的 所 有 子 集 。 这 种 方法 涉及 寻 
找 max- D/2~ 关 条 直线 ， 然 后 对 每 个 点 ， 与 所 有 直线 执行 CD)Czxa 一 1))/2~r 次 比较 。 这 种 方法 因为 计算 
量 太 大 而 基本 上 没有 应 用 价值 。 

霍 夫 [Hough 1962] 提 出 一 种 蔡 代 方法 , WAREKE. HE 多 平面 上 的 一 点 a, y) 和 和 斜 截 式 


755 形式 为 y, = ax; +b 的 一 条 直线 。 通 过 点 (x,,y) 的 直线 有 无 数 条 ， 且 对 a 和 bb 的 不 同 值 ， 它 们 都 满足 方 
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Ey = ax;+b。 然 而 ,将 该 等 式 写 为 p=-x;a+y;， 并 考虑 ab 平 面 (也 称 为 参数 空间 ) ， 将 得 到 固定 点 


(xyi) 的 单条 直线 方程 。 此外, 第 二 个 点 (x;,y)) 在 参数 空间 中 也 有 一 条 与 之 相关 联 的 直线 , 除非 它们 
平行 ， 否 则 这 条 直线 会 与 和 (x,.y,) 相关 联 的 直线 相交 于 点 (a，b)， 其 中 a ARLE, DEAE x Fi 
Aay) 和 点 (xj,y)) 的 直线 的 截 距 。 事实 上 ， 这 条 直线 上 的 所 有 点 在 参数 空间 中 都 有 相交 于 点 (a b) 
的 直线 。 图 10.31 说 明了 这 些 概 念 。 


ab 





b = -xja + yi 


b= =yä t y 


图 10.31 (a)y FH; (b) 参数 空间 


原理 上 ， 可 以 画 出 对 应 于 y 平面 中 所 有 点 (xy) 的 参数 空间 直线 ， 且 空间 中 的 主要 直线 可 以 在 
参数 空间 中 通过 确定 的 点 来 找到 ， 参 数 空间 的 大 量 线 在 此 点 处 相交 。 但 这 种 方法 的 一 个 问题 是 ， 当 该 
直线 逼近 垂直 方向 时 ，&( 直 线 的 斜率 ) 会 趋 于 无 限 大 。 解 决 该 问题 的 方法 之 一 是 , 使 用 一 条 直线 的 法 线 
表示 : 

xcosO+ysing= p (10.2-38) 


图 10.32 (a) 示例 了 参数 和 8 的 几何 解释 。 水 平 直线 有 09= 0" ，P 等 于 正 的 x 截 距 。 类 似 地 ， TAA 
线 有 0 = 90。，P 等 于 正 的 了 BEB; 或 者 有 0= -90。 ，p 等 于 负 的 y 截 距 。 图 10.32 (b) 中 的 每 条 正弦 
曲线 表示 通过 区 平面 中 某 个 特殊 点 (p Ve) 的 一 族 直线 。 图 10.32 (b) 中 的 交点 (p',9") 对 应 于 图 10.32 (a) 
中 通过 点 y) 和 点 (%j,y)) 的 直线 。 


y 
Pmin 


x,cos@ 十 yising = p 





x;cos@ + yiSinb = p 





p 


图 10.32 (a)xy 平 面 中 直线 的 (p,9) 参数 化 ; (b) p0 平面 中 的 正弦 曲线 ， 交 点 (20) 对 应 
于 通过 区 平面 中 点 y) 和 点 (xj,y)) 的 直线 ; (ce) pO 平面 划分 为 累加 单元 


霍 夫 变换 计算 上 的 魅力 在 于 可 将 pb 参数 空间 划分 为 所 谓 的 累加 单元 , 如 图 10.32(c) 所 示 , 其 
HP (Prins Pmax) FIC Onin Ona) 是 所 期 望 的 参数 值 范 围 ，-90*<9<90°* 和 -D<p<D,D 是 图 像 中 
对 角 之 间 的 最 大 距离 。 坐 标 (i, j) 处 的 单元 具有 累加 值 4(i, j), 它 对 应 于 与 参数 空间 坐标 (/p;,9,) 相关 
联 的 正方 形 。 最初， 将 这 些 单 元 置 为 零 。 然 后 ， 对 于 y 平面 中 的 每 个 非 背景 点 (x,y)， 令 9 等 于 
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0 轴 上 每 个 允许 的 细 分 值 ， 同 时 使 用 方程 p= x, cos + y, sin9 解 出 对 应 的 p 。 对 得 到 的 p (ETS 
HA, FARE p 轴 的 最 接近 的 允许 单元 值 。 铬 选择 的 一 个 9, 值得 到 解 p, ， 则 令 A(p,g)=A(p, q) +1. 在 


这 一 过 程 结束 后 , 4(i, 站 中 的 值 P 将 意味 着 地 平面 中 有 PP 个 点 位 于 直线 xcos0,++ ysing, =p, +. p0 F 


面 中 的 细 分 数量 决定 了 这 些 点 的 共 线 精度 。 可 以 证 明 (UL 10.24) , 刚刚 讨论 的 这 种 方法 的 计算 次 数 
与 xy 平 面 中 非 背 景点 的 数量 n 呈 线 性 关系 


例 10.13 基本 霍 夫 变 换 性 质 的 说 明 。 

图 10.33 显示 了 基于 式 (10.2-38) 的 霍 夫 变换 。 图 10.33 (a) 显示 了 一 幅 夫 小 为 101x101 像素 并 带 有 五 个 
标记 点 的 图 像 , 图 10.33 (b) 显示 了 使 用 p 轴 和 8 轴 的 单位 细 分 将 每 个 点 映射 到 p64 平面 上 的 结果 。 9 的 取 值 
范围 为 上 90"，P 轴 的 范围 为 +V2 D， 其 中 D 是 图 像 中 对 角 点 间 的 距离 。 如 图 10.33 (e) 所 示 ， 每 条 曲线 都 
有 不 同 的 正弦 曲线 形状 。 点 1 的 映射 得 到 的 水 平 直 线 ， 是 具有 零 幅 值 的 正弦 曲线 的 一 种 特殊 情形 

图 10.33 (b) 中 标 为 4( 不 要 与 累加 值 混 淆 ) 和 8 的 点 显示 了 霍 夫 变换 的 共 线 性 检测 性 质 。 点 4 表示 对 应 

> oxy 图 像 平 面 内 点 1,3 和 5 的 曲线 的 交点 。 点 4 的 位 置 指出 这 三 个 点 位 于 一 条 过 原点 (p=0) 目 方向 为 45° 
上 [ 见 图 10.32 (a) ]。 类 似 地 ， 在 参数 空间 中 相交 于 点 8 的 曲线 指出 ， 点 2, 3 和 4 位 于 方向 为 -45° 
目 与 原点 的 距离 为 p = 71( 即 从 图 像 原 点 到 对 角 的 对 角 线 距离 的 一 半 ， 已 四 舍 五 入 为 最 接近 的 整数 值 ) 的 直 
Kt. 最 后 , 图 10.33 (b) 中 标 为 0,R 和 5S 的 点 说 明了 这 样 一 个 事实 , 即 霍 夫 变换 展示 了 在 参数 空间 左边 缘 
和 右边 缘 处 的 一 种 反射 邻接 关系 。 这 一 性 质 是 9 和 p 在 土 90° 边 界 改 变 符号 的 结 
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图 10.33 (a) @@5 个 点 的 、 大 小 为 101x101 像素 的 图 像 ，(b) 对 
应 的 参数 空间 [ 为 便于 观看 ， 图 (a) 中 的 点 已 被 放大 


尽管 到 目前 为 止 我 们 关注 的 重点 始终 在 直线 上 ,但 霍 夫 变换 也 适用 于 形 如 g(v,c)=0 的 任何 函数 ， 
其 中 * 是 坐标 向 量 ，c 是 系数 向 量 。 例 如 ， 位 于 圆 

(x-¢,) +o- =cF (10.2-39) 
上 的 点 可 以 使 用 刚才 讨论 的 方法 来 检测 。 不 同 之 处 是 存在 3 个 参数 (ci ,ec Alc) ,在 eee 
中 ,这 三 个 参数 导致 了 类 似 立体 的 单元 和 形 如 AG, 7, OR Bes. ERE, F 加 Filc, ， 求 出 满足 
xX (10.2-39) 的 cs ， 并 更 新 与 三 元 组 (ci ,c,,c; ) 相 关联 的 累加 单元 。 很 明显 ， 霍 夫 变换 的 复杂 性 取决 
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于 给 定 函 数 表达 式 中 的 坐标 和 系数 数量 。 和 霍 夫 变换 有 可 能 进一步 推广 到 检测 无 简单 解析 表达 式 的 曲线 ， 


如 变换 为 灰 度 级 图 像 那样 的 应 用 。 本 章 末 尾 包含 了 处 理 这 些 扩展 功能 的 一 些 参 考 文献 。 
现在 回 到 边缘 连接 问题 。 基 于 霍 夫 变换 的 一 种 连接 方法 如 下 : 
1. 使 用 本 节 中 讨论 的 任何 技术 得 到 一 幅 二 值 图 像 。 
2. 指定 p0 平 面 中 的 细 分 
3. 对 像素 高 度 集中 的 地 方 检 验 其 累加 单元 的 数量 。 
4. 检验 选中 单元 中 像素 间 的 关系 (主要 针对 连续 性 ) 。 


在 这 种 情况 下 ， 连 续 性 通常 以 对 应 于 给 定 的 累加 单元 计算 不 连续 像素 间 的 上 距离 为 基础 。 知 缝 辽 的 
长 度 比 指定 的 阔 值 小 ， 则 连接 与 给 定单 元 相关 联 的 一 条 直线 中 的 缝 院 。 注 意 ， 仅 以 方向 为 基础 聚合 直 
线 的 事实 是 一 个 可 用 于 整个 图 像 的 全 局 概念 ， 它 仅 要 求 我 们 考察 与 指定 累加 单元 相关 联 的 像素 。 
两 节 中 讨论 的 方法 相 比 ， 这 是 一 个 明显 的 优点 。 下 例 说 明了 这 些 概念 。 


例 10.14 使 用 霍 夫 变 换 连 接 边缘 。 


图 10.34 (a) 显示 了 一 幅 航拍 的 机 场 图 像 。 该 例 的 目的 是 使 用 霍 夫 变换 提取 主要 跑道 的 两 条 边 。 解 决 这 
样 的 问题 可 能 很 重要 ， 例 如 ， 涉 及 飞行 器 自动 导航 的 应 用 。 


与 前 





图 10.34 ” (a) 一 幅 大 小 为 502x564 的 机 场 航 拍 图 像 ; (O) 使 用 坎 尼 算法 得 到 的 边缘 
EUR; (c) 霍 夫 参数 空间 ( 方 框 强 调 了 与 长 垂直 线 相关 联 的 点 ); (d) 图 像 
平面 中 对 应 于 方 框 所 强调 的 点 的 直线 ; (e) 已 至 加 到 原 图 像 上 的 直线 


第 一 步 是 得 到 一 幅 边 缘 图 像 。 图 10.34(b) 显示 了 使 用 坎 尼 算法 得 到 的 边缘 图 像 ， 算 法 中 使 用 的 参数 和 
过 程 与 例 10.9 中 的 相同 。 为 计算 霍 夫 变换 ， 使 用 10.2.5 节 或 10.2.6 节 中 讨论 的 任何 边缘 检测 技术 ， 可 得 到 
类 似 的 结果 。 图 10.34 (c) 显示 了 0 以 1° 递 增 和 pp 以 1 像素 递增 得 到 的 霍 夫 参 数 空间 。 

跑道 偏离 正 北 方向 约 1?， 所 以 我 们 选取 对 应 于 490° 并 包含 最 高 数量 的 单元 ， 因 为 跑道 在 这 些 方向 面 
问 最 长 的 线 。 图 10.34(c) 的 边缘 上 的 小 自 框 强调 了 这 些 单元 ; 结合 图 10.33 (b) ， 如 先前 提 及 的 那样 ， 霍 夫 
变换 展示 了 边缘 处 的 邻接 性 。 解释 这 一 性 质 的 另 一 各 方法 是 ， 面 向 +90。 的 一 条 线 和 面向 -90° 的 一 条 线 是 等 
价 的 ( 即 它 们 是 两 条 垂直 线 ) 。 图 10.34(q) 显示 了 对 应 于 刚才 讨论 的 两 个 累加 单元 的 直线 , 图 10.34(e) 显示 
了 已 全 加 到 原 图 像 上 的 这 些 直 线 。 这 些 直线 是 通过 连接 不 超过 图 像 高 度 的 20%( 约 100 个 像素 ) 的 所 有 间隙 得 
到 的 。 这 些 直 线 清楚 地 对 应 于 感 兴 趣 跑道 的 边缘 。 
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STASI CANSAR, IRAE 
参数 ， 例 如 相对 于 图 像 尺 十 的 直线 的 预 其 长度， 就 像 


10.3 WAA 


Fa (AChE EOL, 实现 简单 且 计 算 速 度 块 , NR EAEE RRA RI PE TFIO. 
3.1.1 PEMA TREH, A ABIES ATE RRA Tse AE aE, AE EON TECH 
值 处 理 。 


10.3.1 基础 知识 


在 前 面 的 章节 中 ， 我 们 采用 首先 寻找 边缘 线段 ， 然 后 将 这 些 线段 连接 为 边界 的 方法 来 识别 区 域 。 
本 节 讨 论 基 于 灰 度 值 和 /或 灰 度 值 的 特性 来 将 图 像 直 接 划 分 为 区 域 的 技术 。 


灰 度 阅 值 处 理 基础 


假设 图 10.35 (a) 中 的 灰 度 直方 图 对 应 于 图 像 (x, y)， 该 图 像 由 暗色 背景 上 的 较 亮 物体 组 成 ， 以 这 
样 的 组 成 方式 ， 物 体 像素 和 背景 像素 所 具有 的 灰 度 值 组 合成 了 两 种 支配 模式 。 从 背景 中 提取 物体 的 一 
种 明显 方法 是 ， 选 择 一 个 将 这 些 模 式 分 开 的 靖 值 7。 然 后 ，f (x, 力 >Z 的 任何 点 Co 习 称 为 一 个 对 象 点 ; 
否则 该 点 称 为 背景 点 。 换 句 话 说， 分 割 后 的 图 像 g(x,») 由 下 式 给 出 : 


fh £0, DSP 
Gy ja Fe yet 
当 7 是 一 个 适用 于 整个 图 像 的 常数 时 ， 上 式 给 出 的 处 理 称 为 全 局 阅 
值 处 理 。 当 T 信 在 一 幅 图 像 上 改变 时 ， 我 们 使 用 可 变 韶 值 处 理 这 一 | pomenmimem cement 
术语 。 术 语 局 部 闪 值 处 理 或 区 域 准 值 处 理 有 时 用 于 表示 可 变 靖 值 处 “| 素 的 约定 , 但 在 式 (10.3-]) 中 也 可 使 用 
理 , 此 时 , 图 像 中 任何 点 (x, 习 处 的 工 值 取决 于 (x, y) 的 邻 域 的 特性 ( 例 “| 任何 两 个 明显 不 同 的 值 
如 邻 域 中 的 像素 的 平均 灰 度 ) 。 若 了 取决 于 空间 坐标 (x, ACS, 则 可 变 阔 值 处 理 通常 称 为 动态 阅 值 
处 理 或 自 适 应 阔 值 处 理 。 这 些 术 语 的 应 用 并 不 普遍 ， 在 关于 图 像 处 理 的 文献 中 ， 读 者 可 能 会 看 到 
它们 交替 地 使 用 。 
图 10.35 (b) 显示 了 一 个 更 为 困难 的 阔 值 处 理 问题 ， 它 包含 有 三 个 支配 模式 的 直方 图 ， 例 如 ， 这 三 
个 支配 模式 对 应 于 暗色 背景 上 的 两 个 明亮 物体 。 这 里 ， 若 f(x,y) < 7 ， 则 多 阔 值 处 理 把 点 (x, ys 
背景 ; 着 <(%,y) < 二 ， 则 分 类 为 一 个 物体 ; 若 fx 必 > 五 ， 则 分 类 为 另 一 个 物体 。 即 分 割 的 图 像 
由 下 式 给 出 : 


(10.3-1) 





a, f(x, y)>T, 
g(x, y)=4b, T<f(x, y)<T (10.3-2) 
c, f(x, y) ST, 
sth, a, b 和 c 是 任意 三 个 不 同 的 灰 度 值 。 在 10.3.6 HP, FADO, BRP EB 
?到 值 的 分 割 问题 很 难 解决 通常 是 不 可 能 的 ) ， 而 较 好 的 结果 通常 可 用 其 他 方法 得 到 ， 如 10.3.7 节 中 讨论 
el] 的 可 变 立 值 处 理 方法 或 10.4 节 中 讨论 的 区 域 生长 方法 。 
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基于 前 面 的 讨论 ,我 们 可 以 凭 直觉 推断 灰 度 阔 值 的 成 功 与 否 直接 关系 到 可 区 分 直方 图 模式 的 波 谷 
的 宽度 和 深度 。 而 影响 波 谷 特性 的 关键 因素 是 : (1) 波 峰 间 的 间隔 (波峰 离 得 越 远 ， 分 离 这 些 模式 的 机 
会 越 好 ) ; (2) 图像 中 的 噪声 内 容 (模式 随 噪声 的 增加 而 展 宽 ) ; (3) 物体 和 背景 的 相对 尺寸 ; (4) 光 源 的 
3 匀 性 ; (5) 图 像 反 射 特 性 的 均匀 性 。 


图 像 阔 值 处 理 中 噪声 的 作用 


作为 噪声 如 何 影响 一 幅 图 像 的 直方 图 的 说 明 , 考虑 图 10.36 (a) 。 这 幅 简 单 的 合成 图 像 中 没有 噪声 ， 
因此 ， 其 直方 图 由 两 个 波峰 模式 组 成 ， 如 图 10.36 (d) 所 示 。 将 该 图 像 分 割 为 两 个 区 域 很 简单 ， 只 需 将 
一 个 国 值 放 到 两 个 模式 之 间 的 任何 位 置 。 图 10.36(b) 显示 了 被 均值 为 零 、 标 准 差 为 10 个 灰 度 级 的 高 斯 
噪声 污染 了 的 原始 图 像 。 尽 管 相应 的 直方 图 模式 现在 较 宽 [ 见 图 10.36(e) ], 但 它们 的 间隔 足够 大 ， 故 
它们 之 间 波 谷 的 深度 足以 使 得 两 个 模式 更 易于 分 开 。 放 在 两 个 波峰 之 间 的 中 间 位 置 的 一 个 阔 值 就 可 以 
很 好 地 分 割 该 图 像 。 图 10.36(c) 显示 了 受到 均值 为 零 、 标 准 差 为 50 个 灰 度 级 的 高 斯 噪声 污染 该 图 像 的 
结果 。 如 图 10.36 (中 所 示 的 直方 图 那样 , 现在 情况 是 如 此 严重 ,以 至 于 无 法 区 分 两 个 模式 。 车 没有 附 
加 的 处 理 ( 如 10.3.4 节 和 10.3.5 节 中 讨论 的 方法 ) ， 我 们 对 于 分 割 这 样 的 图 像 寻 找 合 适 的 浆 值 就 没有 什 


么 希望 。 


abc | 
defi 5 s k =I I n 


图 10.36 (a) 无 噪声 的 8 比特 图 像 ， \b) 带 有 均值 为 零 、 标 准 差 为 10 个 灰 度 级 的 加 性 高 斯 噪声 的 图 像 ; 
《c) 带 有 均值 为 零 、 标 准 差 为 50 个 灰 度 级 的 加 性 高 斯 噪声 的 图 像 ， (d)~ (全 相应 的 直方 图 


光照 和 反射 的 作用 
图 10.37 说 明了 光照 对 一 幅 图 像 的 直方 图 的 影响 。 图 10.37(a) 是 来 自 图 10.36 (b) 的 噪声 图 像 ， 图 


~ 


图 10.37 (d) AN TENET. BIRARE, SEAI—“S AERA AAR. 我们 可 以 通过 一 个 262 
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可 变 的 灰 度 函数 乘 以 图 10.37(a) 中 的 图 像 来 说 明 非 均匀 光照 的 影响 ， 例 如 ， 图 10.37(b) 的 斜坡 灰 度 ， 其 
直方 图 显示 在 图 10.37(e) 中 。 图 10.37 (c) 显示 了 这 幅 图 像 与 该 阴影 模式 的 乘积 。 如 图 10.37 (所 示 ， 波 
峰之 间 的 较 深 波 谷 在 模式 的 分 离 点 处 被 污染 ， 如 果 不 进行 额外 的 处 理 ( 见 10.3.4 节 和 10.3.5 节 ) ， 分 离 
是 不 可 能 的 。 如 果 光 照 非 常 均匀 ， 但 图 像 的 反射 不 均匀 也 会 得 到 类 似 的 结果 。 例 如 ， 物 体 的 表面 或 背 
景 自 然 反 射 变化 的 情况 就 是 如 此 。 























Cc 
fh 
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FR; (c) 图 (a) 和 图 (b) 的 乘积 (d)~(D 相 应 的 直方 图 










前 面 章节 中 的 关键 是 ， 在 使 用 阔 值 或 其 他 分 割 技术 的 图 像 成 功 分 
割 中 ， 照 明和 反射 起 到 了 核心 作用 。 因 此 ， 在 可 能 的 情况 下 ， 在 解决 
分 割 的 问题 中 ， 首 先 应 考虑 如 何 控制 这 些 参数 。 当 不 可 能 控制 这 些 参 
数 时 ， 有 三 种 针对 该 问题 的 基本 解决 方法 。 第 一 种 方法 是 直接 校正 这 
种 阴影 模式 。 例 如 ， 非 均匀 (但 固定 的 ) 光照 可 以 用 相反 的 模式 与 图 像 | 256.057 的 具有 相同 砍 度 级 数 的 仙 坡 
相 乘 来 校正 , 相反 的 模式 可 以 用 一 个 恒定 灰 度 的 平坦 表面 成 像 来 得 到 。 | 加 像 由 没有 2 和 的 直方 图 

第 二 种 方法 可 通过 用 诸如 9.6.3 节 中 介绍 的 顶 帽 变 换 处 理 来 尝试 校正 全 局 阴影 模式 ,第 三 种 方法 是 使 用 
可 变 阐 值 近似 处 理 非 均匀 性 ， 如 10.3.7 节 讨 论 的 那样 。 


10.3.2 ”基本 的 全 局 阅 值 处 理 


如 前 节 说 明 的 那样 , 当 物体 和 背景 像素 的 灰 度 分 布 十 分 明显 时 , 可 以 用 适用 于 整个 图 像 的 单个 (全 
局 ) 闽 值 。 在 大 多 数 应 用 中 , 通常 图 像 之 间 有 较 大 变化 ,即使 全 局 国 值 是 一 种 合适 的 方法 ,也 需要 有 能 
对 每 幅 图 像 自动 估计 立 值 的 算法 。 下 面 的 迭代 算法 可 用 于 这 一 目的 : 

1. 为 全 局 国 值 了 选择 一 个 初始 估计 值 。 

2. 在 式 (10.3-1) 中 用 了 分 割 该 图 像 。 这 将 产生 两 组 像素 : G 由 灰 度 值 大 于 7 的 所 有 像素 组 成 ， 

G2 由 所 有 小 于 等 于 了 的 像素 组 成 。 
3. 对 G 和 G, 的 像素 分 别 计算 平均 灰 度 值 (均值 )m 和 m2. 
4. 计算 一 个 新 的 国 值 : 


理论 上 ， 和 斜坡 图 像 的 直方 图 是 均匀 
的 。 实 际 上 ， 实现 完美 的 均匀 性 取决 | 
于 图 像 的 尺寸 和 灰 度 比特 数 。 例 如 ， 
一 幅 大 小 为 256x256 的 256 级 斜坡 图 
像 有 一 个 均匀 的 直方 图 ， 但 大 小 为 





1 
T =—(m,+m 
5 om 2) 


5. 重复 步 又 2 到 步骤 4， 直 到 连续 迭代 中 的 了 值 间 的 差 小 于 一 个 预定 义 的 参数 A7 为 止 。 
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当 与 物体 和 背景 相关 的 直方 图 模式 间 存 在 一 个 相当 清晰 的 波 谷 时 ， 这 个 简单 的 算法 工作 得 很 好 。 
在 速度 是 一 个 重要 因素 的 情形 下 , 参数 A7 用 于 控制 迭代 的 次 数 。 通 常 ，A7 BOK, 则 算法 执行 的 迭代 
次 数 越 少 , 所 选 的 初始 国 值 必须 大 于 图 像 中 的 最 小 灰 度 级 而 小 于 最 大 灰 度 级 (见习 题 10.28) 。 图像 的 平 
均 灰 度 对 于 了 来 说 是 较 好 的 初始 选择 。 


例 10.15 全 局 阐 值 处 理 i 
图 10.38 7R T UAL REL AER AT E 10.38 (a) 是 原 图 像 ， 图 10.38 (b) 是 该 图 
像 的 直方 图 ,该 直方 图 显示 有 一 个 明显 的 波 谷 。 用 了 =m (平均 图 像 灰 度 ) 开 始 ， 并 令 AT =0 ， 应 用 前 述 迭 
代 算 法 经 过 3 ye. SIE T= 125.4。 图 10.38(c) 显示 了 使 用 国 值 T= 125 来 分 割 原 图 像 得 到 的 结 
果 。 如 期 望 的 那样 ， 从 直方 图 清晰 的 模式 分 离 中 ， 物 体 和 背景 间 的 分 割 相 当 有 效 。 


7 

















abe 


晰 起 见 ， 边 界 是 加 上 去 的 ) ( 原 图 像 由 美国 国家 标准 和 技术 研究 所 提供 ) 


通过 对 输入 图 像 成 功 地 进行 贱 值 处 理 并 在 每 一 步 计 算 均 值 说 明了 前 述 算法 ， 因 为 以 这 种 方式 来 介 
绍 该 算法 更 为 直观 。 然 而 ， 有 可 能 根据 图 像 的 直方 图 表达 的 全 部 计算 开发 一 种 更 有 效 的 过 程 ， 它 仅仅 
计算 一 次 (见习 题 10.26) 。 


10.3.3 用 Otsu 方法 的 最 佳 全 局 阅 值 处 理 


国 值 处 理 可 视 为 一 种 统计 决策 理论 问题 ， 其 目的 是 在 把 像素 分 配给 两 个 或 多 个 组 (也 称 为 分 类 ) 的 
过 程 中 使 引入 的 平均 误差 最 小 。 这 一 问题 已 知 有 一 个 精致 的 闭合 形式 的 解 ， 称 为 贝 叶 斯 决策 规则 ( 见 
12.2.2 节 ) 。 这 个 解 仅 以 两 个 参数 为 基础 : 每 一 类 的 灰 度 级 的 概率 密度 函数 (PDF) 和 给 定 应 用 中 每 一 类 
出 现 的 概率 。 遗 憾 的 是 ,估计 PDF 并 不 容易 ， 通常 采取 假定 一 个 PDF 形式 的 可 行 方法 来 简化 该 问题 ， 
例如 ， 假 设 它们 是 高 斯 函数 。 即 便 采 用 了 简化 ， 用 这 些 假 设 求解 的 过 程 也 可 能 很 复杂 ,并且 对 实际 应 
用 也 不 总 是 合适 的 。 

本 节 中 讨论 的 Otsu 方法 (Otsu[1979]) 是 男 一 种 有 吸引 力 的 方案 。 该 方法 在 类 间 方 差 最 大 的 情况 下 
是 最 佳 的 ， 这 是 统计 鉴别 分 析 中 所 用 的 测度 。 基 本 概念 是 ， 好 国 值 分 类 就 其 像素 灰 度 值 而 论 ， 应 是 截 
然 不 同 的 ， 反 过 来 说 ， 就 其 灰 度 值 而 言 给 出 最 好 的 类 间 分 离 的 阔 值 就 是 最 好 的 (最 佳 的 ) 阔 值 。 除 了 其 
最 佳 性 之 外 ，Otsu 方法 还 有 一 个 重要 的 特性 ， 即 它 完全 以 在 一 幅 图 像 的 直方 图 上 执行 计算 为 基础 , 直 
方 图 是 很 容易 得 到 的 一 维 阵列 。 

令 {0, 1,2,…,L-1} 表 示 一 幅 大 小 为 MxN 像素 的 数字 图 像 中 的 工 个 不 同 的 灰 度 级 ，n; 表 示 灰 度 级 为 
i 的 像素 数 。 图 像 中 的 像素 总 数 为 MN =m +n +n +--+, 0 (AER ETA OL 3.3 节 ) 具 有 分 
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it p,=n,/MN ， 由 此 有 
L-1 
Dama Ped (10.3-3) 
i=0 


ME, (BB ERE TK) =k, O<k<L—1, IPA ESCA REA AE Cl 和 Cy , 
其 中 ，C 由 图 像 中 灰 度 值 在 区 间 [0, 妇 内 的 所 有 像素 组 成 ，C; 由 灰 度 值 在 区 间 [k+ 1, L- 1] 内 的 所 有 像 
RAUR AE, BRRR C 中 的 概率 Pi(D 由 如 下 的 累积 和 给 出 : 


k 
R(ik)= >, (10.3-4) 
i=0 


换 一 个 角度 看 , 这 是 类 CI 发 生 的 概率 。 例 如 ， 如 果 我 们 置 上 = 0, 则 任何 像素 分 到 类 Ci 中 的 概率 为 零 。 
类 似 地， 类 Cy 发生 的 概率 为 


L-1 
P(k)= >) pi =1-P(k) (10.3-5) 


i=k+1 


由 式 (3.3-18) ， 分 配 到 类 C 的 像素 的 平均 灰 度 值 为 


k 
m(k)= J iPG/C,) 
i=0 


k 
= $ iP(G/)PO/ PC) (10.3-6) 


i=0 





式 中 ，Pi(b 由 式 (10.3-4) 给 出 。 式 (10.3-6) 第 一 行 中 的 P(i/ C) SUE i 的 概率 ,已 知 i 来 自 类 Cl。 该 
式 中 的 第 二 行 来 自 贝 叶 斯 公式 : 
P(A/B) = P(B/ A)P(A)/P(B) 
第 三 行 遵循 这 样 一 个 事实 ， 即 给 定 守 的 Cl 的 概率 P(C /i) 为 1， 因为 我 们 只 处 理 来 自 类 C1 的 i 值 。 此 
外 ，P(Q) 是 第 i 个 值 的 概率 ,很 简单 ， 它 是 直方 图 pQ) 的 第 i 个 分 量 。 最 后 ，P(C) 是 类 CI 的 概率 ， 
由 式 (10.3-4) 我 们 知道 它 等 于 PP(k) o 
类 似 地 ， 分 配 到 类 C 中 的 像素 的 平均 灰 度 值 为 


L-1 


m,(k) = > PUG) 


oe (10.3-7) 
L-1 
“Rw a” 
级 大 的 累加 均值 由 下 式 给 出 : 
k 
m(k) = > ip; (10.3-8) 


i=0 


而 整个 图 像 的 平均 灰 度 \ 即 全 局 均值 ) 由 下 式 给 出 : 


) L- 
ma = > ip, (10.3-9) 
i=0 
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下 面 两 个 公式 的 正确 性 可 通过 直接 代入 前 面 的 结果 来 验证 : 
Pm, + P,m, = mg (10.3-10) 
和 
F+P=1 (10.3-11) 
其 中 ， 为 有 利于 清楚 地 说 明 ， 我 们 暂时 忽略 了 大 项 。 
为 了 评价 级 别 磊 处 的 阔 值 的 “质量 ” ， 我 们 使 用 归 一 化 的 无 量 纲 矩 阵 : 
= (10.3-12) 


式 中 ，o 是 全 局 方差 [ 即 图 像 中 所 有 像素 的 灰 度 方差 ， 如 式 (3.3-19) 给 出 的 那样 ]， 


o= TG-_noy Pi (10.3-13) 
i=0 
o 为 类 间 方 差 ， 它 定义 为 
o2=P(m-—me) +B(m;—mo) (10.3-14) 
该 表达 式 还 可 写 为 
os=RB(m—m,) 
_ (moeP—m)’ (10.3-15) 
R(l-#) 


TP, mg Al m 如 先前 说 明 的 那样 。 该 式 的 第 一 行 来 自 式 (10.3-14) . 
式 (10.3-10) 和 式 (10.3-11) 。 第 二 行 来 自 式 (10.3-5) BSE (10.3-9) 。 这 种 
形式 在 计算 上 更 有 效 一 些 ,因为 全 局 均值 ms 仅 计算 一 次 , 故 对 大 的 任 
何 值 仅 需 要 计算 两 个 参数 mw 和 PP 。 

从 式 (10.3-15) 的 第 一 行 我 们 可 以 看 出 , 两 个 均值 m 和 zw 彼此 隔 得 越 远 ，o3 BOK, 这 表明 类 间 方 
差 是 类 间 的 可 分 性 测度 。 因 为 cz 是 一 个 常数 , 由 此 得 出 7 也 是 一 个 可 分 性 测度 , 且 最 大 化 这 一 测度 等 
价 于 最 大 化 ez 。 然 后 ， 目 标 是 确定 阔 值 5， 它 最 大 化 类 间 方 差 ， 就 像 本 节 开 始 时 说 明 的 那样 。 注 意 ， 
式 (10.3-12) 隐 含 假设 了 cz > 0 。 仅 当 图 像 中 的 所 有 灰 度 级 相同 时 ， 这 一 方 益 才 为 零 ， 这 意味 着 仅 存在 
一 类 像素 。 同 样 ， 这 也 意味 着 对 于 常数 图 像 有 7 = 0 ， 因 为 来 自 其 自身 单个 类 的 可 分 性 为 零 。 

再 次 引入 大 我们 有 最 终结 果 : | 





2 
k 
nk) =) (10.3-16) 


G 


[mP (k) —m(k)P 


2 (A) = aC) = mE 
a= PRW] 


(10.3-17) 
MEABE KR, CRAKE o} (k) : 


on (k*)= pax ， o2(k) (10.3-18) 


换 句 话说 , 为 寻找 k ,我 们 对 k 的 所 有 整数 值 [保持 上 述 0< P) <1 的 条 件 ] 简 单 地 计算 式 (10.3-18) , [7 


并 选取 使 得 o2(k) 最 大 的 大 值 。 如 果 oz (k) 的 最 大 值 对 应 于 多 个 大 值 ， 习 惯 上 是 对 于 使 c3(k) 最 大 的 
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的 各 个 值 做 平均 。 可 以 证 明 ( 见 习题 10.33) ，0< 有 (日 <1 时 ， 总 存在 一 个 最 大 值 。 对 于 所 有 的 大 值 ， 
计算 式 (10.3-17) 和 式 (10.3-18) 的 代价 相对 较 小 ， 因 为 上 所 具有 的 整数 值 的 最 大 数量 是 工 。 
一 旦 得 到 上 ， 输 入 图 像 就 可 像 之 前 那样 进行 分 割 ; 
1, f(x, y)>k* 
Mr, y)'Sk* 
式 中 ,x=0,1,2,…, M-1 Ail y=0, 1, 2,--+, N-10, UA SO, 7 的 直方 图 就 可 以 得 到 计算 式 (10.3-17) 
所 需 的 所 有 参量 。 除 了 最 佳 阔 值 外 ， 与 分 割 图 像 有 关 的 其 他 信息 可 从 直方 图 中 提取 。 例 如 ， 在 最 佳 阔 
值 处 计算 出 的 类 的 概率 有 (Kk") 和 已 (k") ， 指 出 了 经 净值 处 理 后 的 图 像 中 ， 由 该 类 (像素 组 ) 所 占据 的 面 
积 部 分 。 类 似 地 ,均值 m(K") 和 加 (请 ) 是 原 图 像 中 类 的 平均 灰 度 的 估计 。 
在 最 佳 阔 值 处 计算 的 归 一 化 测度 7 , 即 7(e ) ， 可 用 于 得 到 类 别 可 
分 性 的 定量 估计 ， 同 时 给 出 了 很 容易 对 一 幅 给 定 图 像 进行 阔 值 处 理 的 
概念 。 这 一 测度 的 值 域 为 


g(x, n=| (10.3-19) 





O< n(k") <1 (10.3-20) 
如 先前 提 到 的 那样 , 仅 由 单一 且 恒 定 灰 度 级 的 图 像 就 能 得 到 下 界 , 且 仅 由 灰 度 等 于 0 AL — 1 的 二 值 图 
像 就 能 得 到 上 界 ( 见 习题 10.34) 。 
Otsu 算法 小 结 如 下 : 


. 计算 输入 图 像 的 归 一 化 直方 图 。 使 用 p, ,i= 0, 1,2,---,L-1 表示 该 直方 图 的 各 个 分 量 。 

HR 0.3-4), XF k=0,1,2,, L-1, HAREM RP (k) o 

. 用 式 (10.3-8) XF k=0,1,2,---,L-1, HABANA m(k) 。 

用 式 (10.3-9) 计算 全 局 灰 度 均值 me o 

. 用 式 (10.3-17) ， 对 于 k=0, 1,2,…, 上 -1， 计算 类 间 方 差 o?(k) o 

.得 到 Otsu 阔 值 上 ， 即 使 得 o2(k) 最 大 的 天 值 。 如 果 最 大 值 不 唯一 ， 用 相应 检测 到 的 各 个 最 大 
值 大 的 平均 得 到 夺 。 

7. 在 k=k 处 计算 式 (10.3-16) ， 得 到 可 分 性 测度 7 。 


下 面 的 例子 说 明了 前 述 概念 。 


例 10.16 ”使 用 Otsu 方法 的 最 佳 全 局 阔 值 处 理 。 | 

图 10.39 (a) 显示 了 聚合 细胞 的 光学 显 微 图 像 ， 图 10.39 (b) 显示 了 其 直方 图 。 该 例子 的 目的 是 从 背景 
中 分 割 出 分 子 。 图 10.39 (c) 是 使 用 前 节 给 出 的 基本 全 局 阔 值 处 理 算法 得 聚合 细胞 是 使 用 聚合 物 人 工 生成 
到 的 结果 。 因 为 直方 图 没有 明显 的 波 谷 ， 且 背景 和 物体 间 的 灰 度 差别 很 | 的 细胞 。 人 眼看 不 到 聚合 细胞 ， 这 种 
小 , 所 以 算法 未 完成 期 望 的 分 割 。 图 10.39(d) 显示 了 使 用 Otsu 方法 得 到 “| ETLAT AE HEE 
的 结果 。 该 结果 明显 好 于 图 10390 中 的 结果 。 使 用 基本 算法 计算 出 的 Le 
阔 值 是 169， 而 使 用 Otsu 方法 计算 出 的 阔 值 是 181, Fed SLIM GX MM IEE. avi 
WEE y 是 0.467- 

有 趣 的 是 , 将 Otsu 方法 应 用 于 例 10.15 中 的 指纹 图 像 ， 得 到 的 姜 信 和 可 分 性 测度 分 别 为 125 和 0.944。 
该 阔 值 与 使 用 基本 算法 得 到 的 阔 值 (已 四 含 五 人 为 最 接近 的 整数 ) 大 小 相同 。 对 给 定 该 直方 图 的 特性 , 这 一 
结果 并 不 意外 : 事实 上 ， 由 于 原来 的 模式 间 的 分 离 度 相对 较 大 ,并 且 它 们 之 间 的 波 谷 较 深 ， 所 以 可 分 性 测 
度 较 高 。 | 
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图 10.39 (a) 原 图 像 ，(b) 直方 图 (为 突出 低 值 中 的 ， 高 峰 已 被 裁 前 ) ;，(c) 用 10.3.2 节 的 基本 全 局 算法 得 到 
的 分 割 结果 ; (d) Otsu 方法 得 到 的 结果 me, re A JE WAN Daniel A. Hammer 教授 提供 ) 


10.3.4 用 图 像 平 滑 改 善 全 局 阀 值 处 理 


如 图 10.36 中 解释 的 那样 ， 噪 声 会 将 简单 的 阔 值 处 理 问 题 变 为 不 可 解决 的 问题 。 当 噪声 不 能 在 源 
头 减少 ， 并 且 阔 值 处 理 又 是 所 选择 的 分 割 方法 时 ， 那 么 通常 能 增强 性 能 的 一 种 技术 是 ， 在 阔 值 处 理 之 
前 平滑 图 像 。 我 们 用 一 个 例子 来 说 明 这 一 方法 。 

图 10.40 (a) 是 来 自 图 10.36 (c) 的 图 像 , 图 10.40 (b) 显示 了 其 直方 图 , 图 10.40(c) 是 使 用 Otsu 方法 
对 图 像 进行 冰 值 处 理 后 的 结果 。 白 色 区 域 中 的 每 个 黑 点 和 黑色 区 域 中 的 每 个 白 点 是 国 值 处 理 的 误差 ， 
< 以 分 割 很 不 成 功 。 图 10.40 (d) 显示 了 使 用 一 个 大 小 为 5x5 (图 像 大 小 为 651x814 像素 ) 的 均值 模板 平 

滑 噪 声 图 像 后 的 结果 ， 图 10.40 (e) 是 其 直方 图 。 由 于 平滑 处 理 ， 直 方 图 形状 的 改进 很 明显 ， 因 此 我 们 
SS GE LA EN 近 于 完美 。 如 图 10.40 (所 示 ， 事 实 的 确 如 此 。 经 
平滑 和 分 割 后 的 图 像 中 ， 物 体 和 背景 间 的 边界 稍微 有 点 失真 是 由 于 对 边界 的 模糊 造成 的 。 事 实 上 , 我 
们 应 该 预料 到 ， 对 一 幅 图 像 平 滑 多 越 多 ， 分 割 后 的 结果 中 的 边界 误差 就 越 大 。 
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图 10.40 (a) RAB 10.36 的 噪声 图 像 ，(b) 该 图 像 的 直方 图 ; (ce) 用 Otsu 方 
法 得 到 的 结果 ; (d) 用 一 个 大 小 为 5x5 的 均值 模板 平滑 噪声 图 像 的 
结果 ; (e) 结 果 图 像 的 直方 图 ; (用 Otsu 方法 国 值 处 理 后 的 结果 
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下 面 我 们 考虑 降低 图 10.40 (a) 中 相对 于 背景 的 区 域 大 小 所 带 来 的 影响 。 图 10.41 (a) 显示 了 该 结 
果 。 这 幅 图 像 中 的 噪声 是 均值 为 零 、 标 准 差 为 10 个 灰 度 级 (相对 于 前 一 例子 中 的 50) 的 加 性 高 斯 品 
声 。 如 图 10.41 (b) 所 示 ， 直 方 图 没有 清晰 的 波 谷 ， 因 此 我 们 应 该 预料 到 分 割 会 失败 , 图 10.41(c) 中 的 
结果 确认 了 这 一 事实 。 图 10.41(d) 显示 了 使 用 大 小 5x5 的 均值 模板 对 图 像 进行 平滑 后 的 结果 ， 
图 10.41 (e) 是 其 直方 图 。 如 预料 的 那样 ， 最 终结 果 减 小 了 直方 图 的 扩散 ， 但 分 布 仍 呈 单 峰 形式 。 如 
图 10.41 (人 所 示 ， 分 割 再 次 失败 。 失 败 的 原因 可 归于 这 样 一 个 事实 ， 即 区 域 太 小 ， 以 至 于 该 区 域 
对 直方 图 的 贡献 与 由 噪声 引起 的 灰 度 扩散 相 比 无 足 轻重 。 在 这 种 情形 下 ， 下 一 节 讨 论 的 方法 可 能 
更 成 功 。 











abe 
def 


图 10.41 (a) 品 声 图 像 ; (b) 其 直方 图 ; (c) 用 Otsu 方法 得 到 的 结果 ; (d) 用 大 小 为 5x5 
的 均值 模板 平滑 噪声 图 像 后 的 结果 ; (〈e) 结 果 图 像 的 直方 图 ;四 用 Otsu 
方法 对 图 像 进行 阔 值 处 理 后 的 结果 。 两 种 情形 下 ， 立 值 处 理 均 失败 





10.3.5 ”利用 边缘 改进 全 局 阅 值 处 理 


基于 前 四 节 的 讨论 , 我 们 得 出 如 下 结论 : 如 果 直 方 图 的 波峰 是 高 、 窗 、 对 称 的 , 且 被 深 波 谷 分 开 ， 
则 选取 一 个 “ 较 好 ” 靖 值 的 机 会 相当 大 。 改 进 直方 图 形状 的 一 种 方法 是 ， 仅 考虑 那些 位 于 或 靠近 物体 
和 背景 间 的 边缘 的 像素 。 一 种 直接 上 且 明显 的 改进 是 ， 直 方 图 很 少 依赖 物体 和 背景 的 相对 大 小 。 例 如 ， 
大 背景 区 域 上 一 个 小 物体 (或 相反 ) 组 成 的 图 像 的 直方 图 会 有 一 个 较 大 的 波峰 ， 因 为 一 种 类 型 的 像素 高 。 
度 集中 。 在 前 一 节 中 我 们 已 了 解 到 ， 这 可 能 会 导致 国 值 处 理 失败 。 

如 果 仅 用 位 于 或 接近 物体 和 背景 间 的 边缘 的 像素 ， 则 得 到 的 直方 图 将 有 几 个 高 度 近似 相同 的 波 
峰 。 此 外 , 像素 位 于 物体 上 的 概率 将 近似 等 于 其 位 于 背景 中 的 概率 ， 从 而 改进 了 直方 图 模式 的 对 称 性 。 
最 后 ， 如 下 段 中 指出 的 那样 ， 使 用 满足 某 些 基于 梯度 和 拉 普 拉 斯 算 子 的 简单 测度 的 像素 ， 有 加 深 直 方 
图 波峰 间 的 波 谷 的 倾向 。 

刚才 讨论 的 方法 假设 物体 和 背景 间 的 边缘 是 已 知 的 。 很 明显 ,该 信息 在 分 割 期 间 是 不 可 用 的 ， 
因为 寻找 物体 和 背景 间 的 分 界线 正好 也 是 分 割 所 要 做 的 工作 。 然 而 ， 根 据 10.2 节 中 的 讨论 ， 一 个 
像素 是 否 位 于 边缘 上 ， 可 通过 计算 其 梯度 或 拉 普 拉 斯 来 确定 。 例 如 ， 在 边缘 的 过 渡 处 ， 拉 普 拉 斯 
的 平均 值 为 零 ( 见 图 10.10), 因此 , 根据 拉 普 拉 斯 准则 选取 的 像素 所 形成 的 直方 图 的 波 谷 应 该 很 少 。 
这 一 特性 往往 会 产生 上 面 讨 论 的 较 深 波 谷 。 实 际 上 ， 将 用 梯度 图 像 得 到 的 结果 与 使 用 拉 普 拉 斯 图 


的 像 得 到 的 结果 相 比较 ， 后 者 比较 有 利 ， 因 为 它 在 计算 上 更 有 吸引 力 ， 同 时 也 是 一 个 各 向 同性 边缘 


检测 需 。 


第 10 章 BR Fi 485 
前 述 讨论 可 小 结 为 如 下 算法 ， 其 中 了 (x,y) 是 输入 图 像 : 


有 可 能 修改 该 算法 以 便 同 时 使 用 
1. 采用 10.2 节 讨 j 耸 的 任何 一 种 方法 来 计算 一 幅 边 缘 图 像 ， 无 论 的 


是 f(x,y) 梯 度 的 幅度 还 是 拉 普 拉 斯 的 绝对 值 均 可 。 绝对 值 。 在 这 种 情况 下 ， 我 们 会 为 每 
2. 指定 一 个 阅 值 7 a S [RR ae to, LASETE. 
3. 用 步骤 2 PREX 1 PRRI TT REDE, FEIE | 当 需 要 对 有 效 的 边缘 点 施加 更 多 的 
二 值 图像 gj (x,y)。 在 从 f(x, 〗 中 选取 对 应 于 “ 强 ” 边 缘 像素 “| 控制 时 ， 这 种 方法 很 有 用 。 
的 下 一 步 中 ， 该 图 像 用 做 一 幅 模板 图 像 。 
4. (UA f(x,y») 中 对 应 于 97 (x.y) 中 像素 值 为 1 的 位 置 的 像素 计算 直方 图 。 
5. 用 步骤 4 中 的 直方 图 全 局 地 分 割 f(x,y)， 例 如 使 用 Otsu 方法 。 


若 将 了 设置 为 小 于 边缘 图 像 的 最 小 值 的 任何 值 ,根据 式 (10.3-1) ，gy(x,y) 将 由 全 1 组 成 ， 这 意味 
着 7Gx) 的 所 有 像素 将 用 于 计算 图 像 的 直方 图 。 在 这 种 情况 下 ,前 述 算 |” 第 ， 个 百分比 天 大 于 给 定 集合 内 
法 变 成 使 用 原始 图 像 的 直方 图 的 全 局 阔 值 处 理 。 习 惯 上 以 百分比 的 形 | 所 有 数字 的 6 的 最 小 数字 。 例 如 
式 来 指定 7 值 ， 百 分 比 通常 设置 得 较 高 (如 90%) ， 以 便 在 计算 中 用 梯 | 站 和 和 让 





且 该 分 数 大 于 参加 此 次 测验 的 所 有 


度 / 拉 普 拉 斯 图 像 中 的 较 少 像素 。 下 面 的 例子 说 明了 刚才 讨论 的 概念 。 | 学 生 中 的 85% 的 学 生得 到 的 分 数 , 则 
第 一 个 例子 使 用 梯度 ， 第 二 个 例子 使 用 拉 普 拉 斯 。 在 两 个 例子 中 ， 无 “| 读者 在 测试 分 数 中 位 于 第 85 个 百 分 
论 使 用 哪 种 方法 都 可 得 到 类 似 的 结果 。 重 要 的 问题 是 生成 一 幅 合 适 的 “| 上 多 

导数 图 像 。 


a u 









e homie E we 它 有 被 个 较 深 波 谷 分 开 
ne ee ER 10420 PO 


ago o o a 
例 10. ` 用 拉 普 拉 其 为 基础 的 边缘 信息 改进 全 局 


望月 四 得 A ae 图 1043 0) 显示 了 该 图 像 的 直方 图 

图 10. Boro oat 方法 直接 用 于 所 示 直方 图 的 图 像 上 得 到 的 结果 我 们 看 到 ,Otsu 方法 未 能 实现 检测 亮 
点 这 一 原始 目标 ， 并 且 ， 尽 管 该 方法 能 隔离 出 某 些 细胞 区 域 本 身 ， 但 右 侧 的 几 个 分 制 后 的 区 域 却 未 分 开 。 

Otsu 方法 计算 出 的 阔 值 是 42， 可 分 性 测度 是 0.636。 

图 10.43( 由 显示 了 图 像 gy(x,y) ， 该 图 像 是 按 如 下 方式 得 到 的 ; 先 计算 拉 普 拉 斯 图 像 的 绝对 值 ， 然后 
用 区 间 [0, 255] 内 的 灰 度 级 115 作为 T 值 进行 六 值 处 理 。 这 个 T 值 近似 对 应 于 拉 普 拉 斯 图 像 绝对 值 中 的 
99.5%, FELIZES AKP E ELSI — RIES, 如 图 10.43 (d) 所 示 。 注意 ， 在 该 图 像 
中 ， 很 多 点 聚集 在 亮点 的 边缘 附近 ， 正如 前 面 的 计 Rowe 的 那样 。 图 10.43(e) 是 图 (a) 和 图 (a) 之 积 的 非 
零 像素 的 直方 图 。 最 后 , 图 10.43() 显示 了 以 图 1 ( 直方 图 为 基础 ， 采用 Otsu 方法 全 局 分 制 原 图 
像 后 的 结果 。 ， 该 结果 与 图 像 中 亮点 的 位 置 一 致 。 用 Otsu 方法 计算 出 的 阔 值 是 115， 可 分 性 测度 是 0.762， 
这 两 个 值 都 要 高 于 使 用 原始 直方 图 得 到 的 值 。 oe 
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图 10.42 ” (a) 来 自 图 10.41 (a) 的 带 噪声 图 像 ; b) 该 图 像 的 直方 图 ; (ec) 在 99. See 
值 处 理 后 的 梯度 幅度 图 像 ，(d) 图 (a) 和 图 (c) 之 积 形成 的 图 像 ; x] (d) 所 示 
图 像 中 非 零 像素 的 直方 图 ;(f) 以 直方 图 (e) 为 基础 ， 用 Otsu eee 分 制图 
BiB. PA 134， 在 该 直方 图 中 处 在 两 个 波峰 间 的 近似 中 间 的 位 置 








abe 
def 


图 10.43 (a) 酵母 细胞 图 像 ; (b) 图 (a) 的 直方 图 ; (c) 使 用 图 (b) 中 的 直方 图 , 用 Otsu 方法 对 
图 (a) 进行 分 割 ;(d) 经 羡 值 处 理 后 的 绝对 拉 普 拉 斯 图 像 ，(e) 图 (a) 和 图 (d) 乘积 中 
的 非 零 像素 的 直方 图 ; (O 以 (e) 中 的 直方 图 为 基础 ， 使 用 Otsu 的 方法 对 原 图 像 进行 
阅 值 处 理 后 的 结果 ( 原 图 像 由 南 加 利 福 尼 亚 大 学 的 Susan L. Forsburg 教授 提供 ) 








在 不 同 百分比 处 设置 阔 值 ， 我 们 甚至 还 可 以 改善 细胞 区 域 的 分 割 。 例 如 ， 图 10.44 显示 了 使 用 前 段 
中 的 相同 步骤 得 到 的 结果 , 但 阅 值 设置 在 55 处 ， 它 近似 拉 普 拉 斯 图 像 最 大 绝对 值 的 5%。 该 值 位 于 图 像 
7 也 ”中 的 所 有 值 的 53.9%. 很 明显 , 这 个 结果 好 于 图 10.43 (c) 所 示 对 原始 图 像 的 直方 图 用 Otsu 的 方法 得 到 的 
wel 结果 。 
775 
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10.3.6 ”多 阅 值 处 理 
迄今 为 止 ， 我 们 关注 的 是 用 单个 全 局 国 值 对 图 像 进行 分 
割 。 我 们 可 将 10.3.3 节 中 介绍 的 国 值 处 理 方法 扩展 到 任意 数量 
的 国 值 ， 因 为 以 这 种 方法 为 基础 的 可 分 性 测度 也 可 以 扩展 到 任 
意 数量 的 分 类 (Fukunaga[1972]) 。 在 天 个 类 Cl,C,…Cx 的 情况 
下 ， 类 间 方 差 可 归纳 为 下 面 的 表达 式 : 





= 》 及 (mx 一 mo (10.3-21) 
k=1 
起 让， 图 10.44 使 用 图 10.43 (d) ~ 中 解释 的 
ahta. Wh ) hZ] 
P, Ea (10.3-22) ARIS, 对 图 10.43 (a) 中 的 图 
iG, 像 进行 分 割 后 的 结果 ， 但 对 绝 
对 拉 普 拉 斯 图 像 进行 阔 值 处 
th =} ip, (10.3-23) By, M Bet ES 
k ieC, 


并 且 , mg FE PH SK(10.3-9) 24 H MADE Kh K- 1 SBOE ES HELE k ke +++, 是 式 (10.3-21) 
的 最 大 值 : 
Gro keo max oot k key) (10.3-24) 


0<k <k, <k, < L-1 


虽然 这 个 结果 通常 很 完美 , 但 当 分 类 数量 增加 时 它 会 开始 失去 意义 , 因为 我 们 仅 处 理 一 个 变量 ( 灰 度 ) 。 
事实 上 , 通常 类 间 方 差 是 依据 以 向 量 描述 的 多 个 变量 来 计算 的 (Fukunaga[1972]) 。 实 际 中 ， 当 我 们 有 
理由 相信 使 用 两 个 阔 值 可 以 有 效 地 解决 问题 时 ,那么 使 用 多 个 全 局 冰 值 处 理 就 被 视 为 一 种 可 行 的 方法 。 
要 求 两 个 以 上 阔 值 的 应 用 ， 通 常 使 用 更 多 的 灰 度 值 来 解决 。 而 该 方法 使 用 的 是 附加 的 描述 子 ( 璧 如 彩 
色 ) ， 并 且 这 种 应 用 是 以 如 10.3.8 节 描 述 的 模式 识别 问题 来 筹划 的 。 
对 于 由 三 个 灰 度 间隔 组 成 的 三 个 类 (这 三 个 类 由 两 个 阔 值 分 隔 ) ， 









类 间 方 差 由 下 式 给 出 . araa PIAS E EAS EL Ach EG HE | 
5 $ Pp PEAR, 
o = P(m,—mg) + P, (m, - mç} + P, (m, -mY (10.3-25) s 
式 中 ， 
ky k, L- 
R=} ps P=} Po B=} r (10.3-26) 
i=0 i=k +1 i=k, +1 
All 
k, l L-1 
如 在 式 (10.3-10) 和 式 (10.3-11) 中 那样 ， 如 下 关系 成 立 ， 
Pm, + Pym, + Pym, = mg (10.3-28) 
和 
P+P,+PR=!1 (10.3-29) 


因此 , 我 们 看 到 , PH, mR oz ABE k Mk AY PR. Pie EBL A” 和 k 是 使 得 os(h,) 最 
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大 的 值 。 换 名 话说， 如 在 1 10.3.3 节 讨 论 的 单 阔 值 情况 那样 ， 我 们 用 下 式 寻找 最 佳 冰 值 : 
o2(k, kz) mA max og(h, k,) (10.3-30) 


该 过 程 由 选择 第 一 个 值 开始 (该 值 是 1;- 因 为 在 0 FREAD SRIRAM; 还 要 记 住 ， 增 量 
值 为 整数 ， 因 为 我 们 处 理 的 是 灰 度 ) 。 接 着 ， 的 所 有 值 在 大 于 如 和 小 于 L-1 的 范围 内 增加 ( 即 
k =k, +1,---,L-2) . 然后 , 将 厂 增 大 到 其 下 一 个 值 ， 的 所 有 值 再 次 在 大 于 的 所 有 值 范 围 内 增加 
重复 该 过 程 ， 直 到 如 =L-3 Aik. 该 处 理 的 结果 是 一 个 二 维 阵列 2(k,k,) ， 最 后 一 步 是 在 该 阵列 中 
寻找 最 大 值 。 对 应 于 最 大 值 的 (EA k (ER ERE A, 和 k,”。 如 果 存 在 几 个 最 大 值 ， 则 平均 对 应 
Fk, Fk, 的 值 来 得 到 最 终 的 阐 值 。 人 然后， 阅 值 处 理 后 的 图 像 由 下 式 给 出 : 

a, if (x, y) < ki 
glx, 7)=1b, ki < f(x, y) ch (10.3-31) 
e JS k 
IF, a,b 和 cc 是 任意 三 个 有 效 的 灰 度 值 。 

最 后 ， 我 们 注意 到 ， 在 10.3.3 节 中 为 单个 交 值 定义 的 可 分 性 测度 可 直接 扩展 到 多 个 靖 值 : 

on(k,, k,) 


OG 


mk; , 局) = (10.3-32) 


OP, of 是 来 自 式 (10.3-13) 的 总 图 像 方差 。 


例 10.19 多 个 全 局 阔 值 处 理 。 

图 10.45 (a) 显示 了 一 幅 冰山 的 图 像 。 这 个 例子 的 目的 是 把 图 像 分 割 成 三 个 区 域 : 暗 背 景 冰山 的 明亮 
区 域 和 阴影 区 域 。 由 图 10.4$(b) 中 的 图 像 直方 图 可 以 看 出 ， 解 决 这 一 问题 需要 有 两 个 浆 值 。 按 上 面 讨论 的 
过 程 得 到 阔 值 后 =80 和 点 "=177 , 由 图 10.45 (b) 注 意 到 , 它们 靠近 两 个 直方 图 波 谷 的 中 心 。 图 10.45 (c) 
是 在 式 (10.3-31) 中 使 用 这 两 个 立 值 得 到 的 分 割 。 可 分 性 测度 是 0.954。 这 个 例子 能 做 到 这 样 好 的 主要 原因 
fe, 能 寻找 到 三 个 具有 明显 可 分 模式 的 直方 图 ， 直 方 图 具有 适度 宽度 和 深度 的 波 谷 。 

















图 10.45 (a) 冰山 图 像 ;(b) 直方 图 ; (c) 用 双 Otsu 阅 值 将 
图 像 分 割 为 三 个 区 域 ( 原 图 像 由 NOAA 提供 ) 


10.3.7 可 变 阅 值 处 理 


777 正如 10.3.1 节 中 讨论 的 那样 ， Ye tr 
作用 。 我 们 在 10.3.4 节 和 10.3.5 节 说 过 ， 图 像 平滑 和 边缘 信息 的 使 用 有 益 于 阔 值 处 理 。 然 而 ， 
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常会 出 现 这 种 情况 ， 即 用 迄今 为 止 讨 论 的 任何 方法 解决 问题 时 ， 要 么 这 种 类 型 的 预 处 理 不 切实 际 ， 要 
么 对 这 一 情形 的 改进 简单 而 无 效 。 在 这 种 情况 下 ， 更 为 高 级 是 复 杂 的 冰 值 处 理 涉及 可 变 冰 值 问题 。 本 
竹 讨 论 选择 可 变 阔 值 的 各 种 技术 


图 像 分 块 
可 变 阔 值 处 理 最 简单 的 方法 之 一 是 ， 把 一 幅 图 像 分 成 不 重生 的 和 矩形。 这 种 方法 用 于 补偿 光照 和 / 


或 反射 的 不 均匀 性 。 选 择 的 矩形 要 足够 小 ， 以 便 每 个 矩形 的 光照 都 近似 是 均匀 的 。 我 们 用 一 个 例子 来 
说 明 这 一 方法 


例 10.20 ”通过 图 像 分 块 的 可 变 阅 值 处 理 。 

图 10.46 (a) 显示 了 来 自 图 10.37 (c) WAR. Fl 10.46 (b) 显示 了 其 直方 图 。 讨 论 图 10.37(c) 时 ,我 们 可 
peice 使 用 一 个 全 局 阔 值 不 能 分 割 该 图 像 ,图 10.46 (c) Fil (d) 已 确认 了 这 一 事实 , 图 10.46 (c) 
和 (d) 分 别 显示 了 使 用 10.3.2 节 中 讨论 的 迭代 方案 和 Otsu 方法 分 割 图 像 后 的 结果 。 两 种 方法 产生 了 可 比较 
的 结果 ， 中 大 量 的 分 割 错误 显而易见 。 

图 10.46 (©) 显示 了 已 细 分 为 6 个 矩形 区 域 的 原 图 像 ,图 10.46 是 对 每 帆 子 图 像 应 用 Otsu 全 局 方法 得 
到 的 结果 。 尽 管 分 割 结果 中 仍然 可 见 一 些 错误 , 但 在 一 幅 分 割 起 来 十 分 困难 的 图 像 上 ， 图 像 细 分 产生 了 合 
理 的 结果 。 分 析 每 幅 子 图 像 的 直方 图 ， 很 容易 就 可 解释 这 种 改进 的 原因 。 如 图 10.47 所 示 ， 每 幅 子 图 像 都 
由 一 个 双 模 式 直方 图 来 表征 ， 两 个 模式 之 间 有 一 个 较 深 的 波 谷 ， 这 是 我 们 所 知 的 将 导致 有 效 全 局 国 值 处 理 
的 一 个 事实 。 
























































图 10.46 (a) 带 噪 声 阴影 的 图 像 ， (b) 该 图 像 的 直方 图 ;(e) 用 来 自 10.3.2 节 的 
全 局 迭代 算法 对 图 (a) 的 分 割 ; (d) 使 用 Oftsu 方法 得 到 的 结果 ; (©) 分 为 
6 幅 子 图 像 后 的 图 像 ， 全 分 别 对 每 幅 子 图 像 应 用 Otsu 方法 的 结果 


当 感 兴趣 物体 和 背景 占据 合理 的 可 比 大 小 的 区 域 时 ， 通 常 图 像 细 分 工作 得 较 好 ， 如 图 10.46 Bras. 
不 是 这 种 情况 时 ， 该 方法 通常 会 失败 ， 因 为 细 分 可 能 只 包含 物体 或 背景 像素 。 虽 然 使 用 其 他 技术 来 确定 何 
时 一 个 细 分 包含 两 种 像素 可 以 解决 这 一 情况 , 但 解决 不 同情 况 所 要 求 的 逻辑 会 变 得 很 复杂 。 在 这 种 情况 下 ， 
使 用 这 一 节 其 余部 分 讨论 的 方法 可 能 更 好 。 
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基于 局 部 图 像 特性 的 可 变 阐 值 处 理 


与 前 一 节 中 讨论 的 图 像 细 分 方法 相 比 ， 更 为 一 
般 的 方法 是 在 一 幅 图 像 中 的 每 点 (x, WTR BM, A 
闵 值 以 一 个 或 多 个 在 (x, ») 邻 域 计算 的 特性 为 基础 。 
虽然 这 可 能 是 有 点 费力 的 处 理 , 但 现代 算法 和 硬件 允 
许 进行 快速 的 邻 域 处 理 ,特别 是 对 于 像 逻 辑 操作 和 算 
术 操作 这 样 的 普通 函数 。 

我 们 用 一 幅 图 像 中 每 个 点 的 一 个 邻 域内 的 像素 
的 标准 差 和 均值 ,来 说 明 局 部 冰 值 处 理 的 基本 方法 。 
这 两 个 量 对 于 确定 局 部 阔 值 非常 有 用 ， 因 为 它们 是 
局 部 对 比 度 和 平均 灰 度 的 描述 子 。 令 cw Fl m,, 表示 
一 幅 图 像 中 以 坐标 (x, ») 为 中 心 的 邻 域 S。 所 包含 的 图 10.47 图 10.46(e) 中 6 幅 子 图 像 的 直方 图 
像素 集合 的 标准 差 和 均值 RT RSA ST, 见 3.3.4 节 )。 下 面 是 可 变局 部 阔 值 的 通用 
形式 : 











Ty = aaw +bm,, (10.3-33) 
AP, a 和 4b 是 非 负 常 数 ， 且 
Ty =ao,, +bmg (10.3-34) 
HF, m 是 全 局 图 像 均 值 。 分 割 后 的 图 像 计算 如 下 : 


_ fh f(x,y) >T,, 
a(x, y)= k fw < (10.3-35) 


AF, f(x, 是 输入 图 像 。 该 式 对 图 像 中 的 所 有 像素 位 置 进 行 求 值 ， 并 在 每 个 点 (x,y) 处 使 用 邻 域 5, 中 
ABARTH AAA AY BEL 

使 用 以 (x,y) 的 邻 域 计算 出 的 参数 为 基础 的 属性 , ARAUBI o ERR S VL cb CT EE 
会 适度 增加 ) : 


fL 0 (局 部 参数 ) 为 真 ; 
TEEN O (局 部 参数 ) 为 候 (10.3-36) 


式 中 , 2 是 以 邻 域 s。 中 像素 计算 的 参数 为 基础 的 一 个 属性 。 例 如 , 考虑 如 下 基于 局 部 均值 和 标准 差 的 
属性 O( Oe, ais ) 

KH, f(x, y)>ao,,AND f(x, y) > bm,, 
假 ， 其 他 

注意 ， 式 (10.3-35) 是 式 (10.3-36) 的 一 种 特殊 情况 ， 它 是 在 f(x,y) > Ty 时 令 2 为 真 ， 而 在 其 他 情况 下 
S O 为 假 得 到 的 。 在 这 种 情况 下 ， 该 属性 仅 简单 地 基于 一 个 点 处 的 灰 度 。 


例 10.21 基于 局 部 图 像 特性 的 可 变 逆 值 处 理 。 
图 10.48(a) 显示 了 来 自 例 10.18 的 醇 母 图 像 。 Ea ieee ec 


Olo m,,) = | (10.3-37) 





780| 种 较 好 分 割 方法 的 假设 是 合理 的 。 图 10.48 8b); 是 使 用 10.3.6 节 中 说 明 的 双 阔 值 处 理 方法 得 到 的 结果 。 
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如 图 所 示 ， 从 背景 中 分 离 出 明亮 区 域 是 可 能 的 ， 但 图 像 右 侧 的 中 等 灰 度 区 域 未 完全 分 审 [回忆 我 们 在 
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例 10.18 中 过 到 过 的 与 图 10.43 (c) 类 似 的 问题 ]。 为 说 明 局 部 闵 值 处 理 的 用 法 ,我 们 用 大 小 为 3x3 的 邻 域 
对 输入 图 像 中 的 所 有 (x, y) 计算 局 部 标准 差 c。 。 图 10.48(c) 显示 了 结果 。 注 意 ， 微 弱 的 外 部 线条 是 如 
何 正 确 地 表征 细胞 的 边界 的 。 接 着 ， 我 们 使 用 全 局 均值 替代 m, 来 形成 式 (10.3-37) 所 示 形 式 的 一 个 属 
性 。 通常， 当 背 景 近似 恒定 ， 且 所 有 物体 的 灰 度 高 于 背景 灰 度 或 低 于 背景 灰 度 时 ， 选 择 全 局 均值 会 给 
出 较 好 的 结果 。 在 完成 的 属性 规范 中 ,使 用 了 值 a= 30 和 2 = 1.5 (在 类 似 这 样 的 应 用 中 ， 这 些 值 通常 
是 通过 试验 确定 的 ) 。 人 然后， 用 式 (10.3-36) 来 分 割 图 像 。 如 图 10.48(d) 所 示 ， 结果 与 输入 图 像 中 的 两 
类 灰 度 的 大 部 分 区 域 十 分 接近 。 尤 其 要 注意 所 有 的 外 部 区 域 完全 被 正确 分 割 ， 且 大 多 数 较 亮 的 内 部 区 
域 也 已 被 正确 地 分 开 。 


abcd 





图 10.48 (a) KAA 10.43 的 图 像 ，(b) 用 10.3.6 节 中 讨论 的 双 阅 值 处 理 方 法 
分 割 的 图 像 ，(c) 局 部 标准 差 图 像 ，(d) 用 局 部 国 值 处 理 得 到 的 结果 


使 用 移动 平均 


刚才 讨论 的 局 部 阀 值 处 理 方法 的 一 种 特殊 情形 ， 是 以 一 幅 图 像 的 扫描 行 计算 移动 平均 为 基础 的 
在 速度 是 一 -种 基本 要 求 的 文档 处 理 中 ， 这 种 实现 相当 有 用 。 通 常 ， 为 减少 光照 偏差 ,扫描 是 以 Z 了 字形 
ee ea THY. A z 表示 步骤 k++ 1 中 扫描 序列 遇 到 的 点 的 灰 度 。 这 个 新 点 处 的 移动 平均 (平均 灰 
E) 由 下 式 给 出 : 
1 k+l 
mk+l)=— > z = m(k) ++ - (Zeri Zin) (10.3-38) 


n i=k+2-n 
式 中 , n 是 用 于 计算 平均 的 点 数 ，m(1) =z/n 。 这 个 初始 值 严格 来 说 并 不 正确 ， 因 为 单 点 的 平均 是 该 
点 自身 的 值 。 然 而 , RANEH mA) = z,/n ,因此 第 一 Green 计算 式 (10.3-38) 时 , 并 不 要 求 特殊 的 计算 
从 另 一 个 角度 看 ， 如 果 图 像 的 边界 填充 了 nn 一 1 个 0， 它 就 是 我 们 将 得 
到 的 那个 值 。 该 算法 仅 初始 化 一 次 ， 而 不 在 每 行 都 初始 化 。 因 为 对 图 | 第 个 表达 式 在 > n_1 时 有 效 | 
pi 的 每 个 点 都 计算 移动 平均 ， 因 此 用 式 (10.3-35) SCRAP, Hep |km, ge 使 用 可 用 点 形 | 
i: a 成 的 。 类 似 地 ， -个 表达 式 在 上 > | 
T, =bm,, ,b 是 常数 , my 是 在 输入 图 像 中 的 点 (x, 处 使 用 式 (10.3-38) |， n+ a | 
得 到 的 移动 平均 x j 





例 10.22 ”用 移动 平均 的 文档 阔 值 处 理 。 

图 10.49(a) 显示 了 -一 幅 以 斑点 灰 度 模式 遮蔽 的 手写 文本 图 像 。 这 种 灰 度 遮 蔽 形式 是 使 用 摄影 办 光 灯 得 到 
的 典型 图 像 。 图 10.49(b) 是 使 用 Otsu 全 局 阔 值 处 理 方法 分 割 的 结果 。 全 局 阔 值 处 理 不 能 克服 灰 度 变化 并 不 意 
外 。 图 10.49(e) 显示 了 采用 移动 平均 的 局 部 阐 值 处 理 成 功 分 割 的 结果 。 经 验 之 一 是 令 n 等 于 平均 笔画 宽度 的 
5 倍 。 在 这 种 情况 下 ， 平 均 宽 度 是 4 个 像素 ， 因 此 我 们 在 式 (10.3-38) 中 令 n=20 并 使 用 b=0.5。 

作为 这 种 分 割 方法 有 效 性 的 另 一 个 说 明 , 我 们 使 用 了 与 前 一 段 中 相同 的 参数 来 分 割 图 10.50(a) 中 的 图 
像 , 该 图 像 被 正弦 型 灰 度 变 化 污染 , 文本 扫描 仪 的 电源 未 适当 接地 时 ,会 出 现 这 种 典型 的 变化 。 如 图 10.50(b) 
和 (c) 所 示 ， 分 割 结果 类 似 于 图 10.49 中 的 那些 结果 。 
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图 10.49 (a) 被 斑点 遮蔽 污染 的 文本 图 像 ;(b) 使 用 Otsu TIAA ey 
值 处 理 的 结果 ; Co) 使 用 移动 平均 的 局 部 阀 值 处 理 的 结果 
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Øl 10.50 (a) E N (b) 使 用 Otsu 方法 的 全 局 
浆 值 处 理 的 结果 ; (c) 使 用 移动 平均 的 局 部 阔 值 处 理 的 结果 


有 趣 的 是 , 使 用 相同 的 4 值 和 4b5 值 ， 两 种 情形 下 均 得 到 了 成 功 的 分 割 结果 ， 这 说 明了 这 种 方法 的 相对 
稳定 性 。 通常 ， 当 感 兴趣 的 物体 与 图 像 尺寸 相 比较 小 (或 较 细 ) 时, 基于 移动 平均 的 阔 值 处 理会 工作 得 很 好 。 
打印 图 像 和 手写 文本 图 像 满 足 这 一 条 件 。 


10.3.8 ”多 变量 阅 值 处 理 


迄今 为 止 ， 我 们 已 涉及 了 基于 单个 变量 ORRE) 的 靖 值 处 理 。 在 某 些 情 况 下 ， 传 感 器 可 产生 多 个 可 
利用 的 变量 来 表征 图 像 中 的 每 个 像素 ， 这 样 ， 就 允许 进行 多 变量 立 值 处 理 。 eee ne 
成 像 ， 其 中 红 (R) 、 绿 (G) AK (B) 分 量 用 于 形成 一 幅 合 成 彩色 图 像 ( 见 第 6 章 ) 。 在 这 种 情况 下 ,每 
td a em ee aS 
色 。 这 些 三 维 点 通常 称 为 体 素 ， 以 便 与 图 像 元 素 相对 应 来 表示 体积 元 素 。 

如 6.7 节 中 讨论 的 某 些 细节 那样 ， 多 变量 阔 值 处 理 可 视 为 一 种 距离 计算 。 假 设 我 们 想 要 从 一 幅 彩 
色 图 像 中 提取 具有 指定 颜色 的 所 有 区 域 ， 比 如 说 ， 微 红色 区 域 。 令 a 表示 我 们 感 兴趣 的 平均 微 红色 。 
基于 这 一 参数 来 分 割 彩 色 图 像 的 一 种 方法 是 ， 计 算 任 意 彩 色 点 z 和 平均 彩色 a 间 的 距离 测度 D(z, a) 
然后 ， 我 们 按 如 下 方式 分 割 输入 图 像 : 





“jE D(z a)<T f 
e-l; 其 他 (10.3-39) 
其 中 , TH—TBUE. 4, 要 在 输入 图 像 中 的 所 有 坐标 上 执行 距离 计算 ,以 便 产 生 相 应 的 分 割 


值 g。 注 意 ,该 式 中 的 不 等 式 与 我 们 在 式 (10.3-1) 中 对 单个 立 值 处 理 所 用 的 不 等 式 相 反 ， 原 因 是 
等 式 D(z, a) =T 定 义 了 一 个 容积 ( 见 图 6.43) ,并 且 它 更 直观 地 把 分 割 后 的 像素 值 想象 为 包含 在 一 
个 容积 中 ， 而 使 背景 像素 值 位 于 该 容积 的 表面 或 外 部 。 令 D(z, a) =—f (x,y), FR (10.3-39) (EAT fä 
化 为 式 (10.3-1) 。 
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IRAT, KESE V> TERK boon f SAR A a Ea OTA. RE, BEA 
理 就 是 基于 距离 测度 的 计算 ， 并 且 式 (10.3-39) 的 形式 依赖 于 所 用 的 测度 。 通 常 ， 如 果 z 是 一 个 n 维 向 
量 ， 我 们 从 2.6.6 TA n 维 欧 几 里 得 距离 定义 为 


1 
D(z, a) =||z—al|=| (z—a)"(z—a) |? (10.3-40) 


等 式 D(z, a) =7T 描 述 了 欧 几 里 得 空间 中 (图 6.4.3 中 显示 了 一 个 三 维 例子 ) 的 一 个 球 ( 称 为 超 球 ) ,一 种 更 
有 用 的 距离 测度 是 所 谓 的 马 氏 (Mahalanobis) 距离 ， 它 定义 为 


1 
D(z, a)= [e -a) cz -a) |? (10.3-41) 


其 中 ， 如 12.2.2 节 讨 论 的 那样 ，C 是 z 的 协 方差 矩阵 。D(z, a)=T 描 述 了 一 个 n 维 超 球 ( 图 6.43 显示 了 
一 个 三 维 例子 ) 。 当 C=T 时 ， 即 它 是 么 阵 时 ， 该 表达 式 就 简化 为 式 (10.3-40) 。 

我 们 在 6.7 节 中 已 给 出 了 一 个 关于 使 用 这 些 表达 式 的 详细 例子 。 我 们 在 12.2 节 中 还 要 讨论 使 用 基 
于 决策 函数 的 模式 识别 技术 来 分 割 图 像 的 问题 ， 这 种 问题 可 视 为 多 类 、 多 变量 阔 值 处 理 问 题 。 


10.4 基于 区 域 的 分 割 


如 10.1 节 中 讨论 的 那样 ， 分 割 的 目的 是 将 一 幅 图 像 划分 为 多 个 区 
域 。 在 10.2 节 中 ,我们 其 于 灰 度 级 的 不 连续 性 尝试 寻找 区 域 间 的 边界 | ee eee ee 
来 解决 这 一 问题 ; 而 在 10.3 节 中 ， 分 割 是 通过 以 像素 特性 分 布 为 基础 ee ei 
的 闵 值 处 理 来 完成 的 ， 如 灰 度 值 或 彩色 。 本 节 讨论 以 直接 寻找 区 域 为 基础 的 分 割 技术 。 


10.4.1 KREK 


如 其 名 字 所 示 的 那样 ， 区 域 生长 是 根据 预先 定义 的 生长 准则 ， 将 像素 或 子 区 域 组 合 为 更 大 区 域 的 
过 程 。 基 本 方法 是 从 一 组 “种 子 ”点 开始 ， 将 与 种 子 预先 定义 的 性 质 相 似 的 那些 邻 域 像素 添加 到 每 个 
种 子 上 ， 来 形成 这 些 生 长 区 域 (如 特定 范围 的 灰 度 或 颜色 ) 。 

如 稍 后 在 例 10.23 中 显示 的 那样 ， 通 常 我 们 可 基于 问题 的 性 质 来 选择 一 组 或 多 组 开始 点 。 当 先 验 
知识 不 可 用 时 ， 这 一 过 程 是 在 每 个 像素 处 计算 相同 特性 的 集合 ， 最 终 在 生长 过 程 期 间 ， 根 据 这 些 特性 
集合 把 像素 分 配给 各 个 区 域 。 如 果 这 些 计算 的 结果 显示 了 一 族 值 ， 则 那些 特性 靠近 这 些 族 的 中 心 的 像 
素 可 以 作为 种 子 使 用 。 

相似 性 准则 的 选择 不 仅 取决 于 所 面 对 的 问题 ， 还 取决 于 现 有 的 图 像 数 据 类 型 。 例 如 ， 土 地 利用 卫 
星 成 像 分 析 非 常 倚重 彩色 的 使 用 。 如 果 彩 色 图 像 中 没有 可 用 的 固有 信息 ， 那 么 解决 这 个 问题 将 非常 困 
难 ， 甚 至 无 法 解决 。 如 果 图 像 是 单 色 的 ， 就 须 使 用 一 组 基于 灰 度 级 和 空间 特性 的 描绘 子 ( 如 和 矩 或 纹理 ) 
对 区 域 进行 分 析 。 在 第 11 章 中 ,我 们 将 讨论 那些 对 区 域 特 征 有 用 的 描绘 子 。 

如 果 在 区 域 生长 过 程 中 未 使 用 连通 属性 那么 单独 的 描绘 子 会 产生 错误 的 结果 。 例 如 ， 设 想 仅 有 
三 个 不 同 灰 度 值 的 像素 的 随机 排列 。 将 具有 相同 灰 度 级 的 像素 组 合 形成 一 个 “区 域 ，, 而 不 考虑 连通 性 ， 
会 产生 对 当前 讨论 内 容 训 无 意义 的 分 割 结果 。 ; 

区 域 生长 的 另 一 个 问题 是 终止 规则 的 表示 法 。 当 不 再 有 像素 满足 加 入 某 个 区 域 的 准则 时 ， 区 域 生 
长 就 会 停止 。 像 灰 度 值 、 纹 理 和 彩色 准则 本 质 上 都 是 局 部 的 ,都 没有 考虑 区 域 生长 的 “历史 ”。 增强 区 
域 生长 算法 能 力 的 其 他 准则 , 利用 了 候选 像素 和 已 加 入 生长 区 域 的 像素 间 的 大 小 、 相 似 性 等 概念 (如 
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候选 像素 灰 度 和 生长 区 域 的 平均 灰 度 的 比较 ) ， 以 及 正在 生长 的 区 域 的 形状 。 这 类 描绘 子 的 使 用 是 以 期 
RS rn nc eee 

令 f(x,y) 表 示 一 个 输入 图 像 阵 列 ; S(x,y) 表 示 一 个 种 子 阵列 ， 阵 列 中 种 子 点 位 置 处 为 1， 其 他 位 置 

处 为 0; 2 表示 在 每 个 位 置 (x, y) 处 所 用 的 属性 。 假设 阵列 了 和 5 的 尺寸 相同 。 基于 8 连接 的 一 个 基本 区 

域 生长 算法 可 说 明 如 下 。 re 

于 连通 分 量 ， 请 参阅 25.2 节 和 | 


L 在 See 思 中 寻找 所 有 连通 分 量 ， 并 把 每 个 连通 分 量 腐蚀 为 一 个 “| 953 节 ; 关于 腐 他 ,请 参阅 92.1 节 。 | 
像素 ; 把 找到 的 所 有 这 种 像素 标记 为 1， 把 8 中 的 所 有 其 他 像素 标记 为 0。 

2. 在 坐标 对 (x,») 处 形成 图 像 fo: 若 输 入 图 像 在 该 坐标 处 满足 给 定 的 属性 2， 则 令 f(x,y) =1, 
否则 令 fo(x,y)=0。 

3. 令 g 是 这 样 形成 的 图 像 : 即 把 f 中 为 8 连通 种 子 点 的 所 有 1 值 点 , 添加 到 5 中 的 每 个 种 子 点 。 

4. 用 不 同 的 区 域 标记 (如 1, 2, 3,…) 标 出 g 中 的 每 个 连通 分 量 。 这 就 是 由 区 域 生长 得 到 的 分 割 
图 像 。 

我 们 通过 一 个 例子 来 说 明 这 种 算法 的 机 理 。 


例 10.23 ”使 用 区 域 生 长 的 分 割 。 

图 10.51(a) 显示 了 一 条 烛 终 (水平 深 色 区 域 ) 的 8 比特 X 射线 图 像 ， 该 图 像 中 含有 几 条 裂缝 和 孔 际 (水 
平 横 穿 图 像 中 心 的 明亮 区 域 ) 。 我们 通过 分 割 有 缺陷 的 焊 颖 区 域 来 说 明 区 域 生长 的 应 用 。 这 些 区 域 可 用 于 
焊 颖 检测， 包括 有 关 历 史学 习 的 数据 库 或 控制 自动 焊接 系统 。 ， 

工作 的 第 一 步 是 确定 种 子 点 。 从 问题 的 物理 性 质 看 , 我 们 知道 裂 儿 和 孔隙 与 实 焊 颖 相 比 , 对 X 射线 的 
衰减 要 小 ， 因 此 ,我 们 预料 包含 这 种 类 型 缺陷 的 区 域 要 比 X 射线 图 像 中 的 其 他 部 分 明显 亮 一 些 。 我 们 
可 用 在 高 百分比 处 设置 阔 值 对 原始 图 像 进行 冰 值 处 理 来 提取 种 子 点 .图 10.51(b) 显示 了 图 像 的 直方 图 ， 
图 10.51 (c) 显示 了 用 等 于 图 像 中 灰 度 值 的 99.5% 的 冰 值 对 图 像 进行 闪 值 处 理 后 的 结果 ， 在 这 种 情况 下 ， 浆 
值 为 254( 见 10.3.5 节 关 于 百分比 的 说 明 ) 。 图 10.51 (d) Eo (ae 10.51 (c) 人 腐 
蚀 为 一 个 单 点 后 的 结果 。 

接 下 来 ,我 们 必须 确定 一 个 属性 。 在 这 个 例子 中 ,我 人 ] 的 兴趣 是 把 满足 如 下 要 求 的 所 有 像素 添加 到 每 
个 种 子 中 : (a) 对 于 种 子 是 8 连接 的 ， 并且 (b) 与 种 子 相似 若 使 用 区 度 差 作为 一 种 相似 性 测度 ， 则 应 用 于 
每 个 位 置 G, 力 处 的 属性 是 

ad | TRUE, 和子 和 We) 的 人 间作 < T 
FALSE, 其 他 






其 中 ,7 是 一 个 指定 的 阐 值 。 虽 然 这 个 属性 是 基于 灰 度 差 的 ， 并 且 使 用 单个 阐 值 ， 但 我 们 可 指定 更 复杂 的 
方案 ， 即 对 每 个 像素 应 用 一 个 不 同 的 阔 值 ， 并 使 用 不 同 于 差 值 的 其 他 属性 。 在 这 种 情况 下 ， 前 述 的 属性 足 
以 解决 该 问题 ， 如 这 个 例子 的 其 余部 分 说 明 的 那样 。 

从 前 面 的 章节 我 们 知道 ,最 小 的 种 子 值 是 255, 因 此 ,使 用 254 的 阔 值 对 图 像 进行 阔 值 处 理 。 图 10.51 (e) 
显示 了 图 10.51 (a) 和 (c) 所 示 图 像 的 差 的 绝对 值 。 图 10.51(e) 中 的 图 像 包 含 了 用 于 计算 每 个 位 置 Cn 处 的 属 
性 所 需要 的 差 值 。 图 10.51(D 显示 了 相应 的 直方 图 。 我 们 需要 一 个 阐 值 , 以 便 用 于 建立 相似 性 属性 。 该 
直方 图 有 三 个 主要 模式 ， 因 此 我 们 首先 把 10.3.6 节 中 讨论 的 双 阔 值 处 理 技术 用 于 差 值 图 像 。 在 这 种 情况 
下 ， 导 致 的 两 个 装 值 是 T = 68 MT, =126 ,我 们 看 到 ， 它 们 相当 靠近 直方 图 的 波 谷 [ 暂 离开 这 一 主题 ， 
我 们 用 这 两 个 净值 分 割 了 图 像 。 图 10.51 (=) RAR T BRL RE RE JAE EAEE 
主要 波 谷中 小 
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图 10.51 (NAESER X IREN: (b) 直方 图 ; 〈c) 初 始 种 子 图 像 ; (d) 最 终 种 子 图 像 
(为 清楚 起 见 , 点 已 被 放大 ) ; (e) 图 (a) 和 图 (c) 之 差 的 绝对 值 ; (人 图 (e) 的 直方 图 ; 
(g) 使 用 双 国 值 进 行 国 值 处 理 后 的 差 值 图 像 ，(h) (AS EET 
的 差 值 图 像 。(i 用 区 域 生 长 得 到 的 分 割 ( 原 图 像 由 X-TEK Systems 有 限 公司 提供 ) 


图 10.51 (h) 显示 了 仅 使 用 五 对 差 值 图 像 进行 闵 值 处 理 的 结果 = 黑 点 是 其 属性 为 “ 真 ”(TRUE) 的 像素 ， 
其 他 点 是 属性 为 “ 假 ”(FALSE) 的 像素 。 这 里 ， 重 要 结果 是 焊 颖 的 良好 区 域 中 断定 为 失败 的 点 ， 因 此 ,这 
些 点 将 不 包含 在 最 终结 果 中 。 外 部 区 域 的 点 将 由 区 域 生 长 算法 作为 候选 点 来 考虑 。 然 而 ,步骤 3 将 拒绝 外 
部 点 ， 因 为 它们 与 种 于 不 是 8 连接 的 。 事 实 上 ， 如 图 10.51 所 示 ， 这 一 步 导 致 了 正确 的 分 割 ， 这 表明 连 
接 性 的 使 用 是 这 种 情况 下 的 一 个 基本 需求 。 最 后 ,注意 ,在 步骤 4 中 ;我们 对 由 该 算法 找到 的 所 有 区 域 使 
用 了 相同 的 值 。 在 这 种 情况 下 ， 它 确实 做 得 很 好 。 


10.4.2 ”区 域 分 裂 与 聚合 


上 一 节 中 讨论 的 过 程 是 从 一 组 种 子 点 来 生长 区 域 。 另 一 种 可 供 选 择 的 方法 是 ， 首 先 将 一 幅 图 像 细 
分 为 一 组 任意 的 不 相交 区 域 , 然后 聚合 和 /或 分 裂 这 些 区 域 , 并 试图 满足 10.1 节 中 图 述 的 分 割 条 件 。 下 
面 讨论 分 裂 和 聚合 的 基础 知识 

令 尽 表示 整 幅 图 像 区 域 , 并 选择 一 个 属性 0。 对 R 进行 分 割 的 一 种 方法 是 , 依次 将 它 细 分 为 越 来 越 
小 的 四 象限 区 域 ， 以 便 对 于 任何 区 域 尺 有 OCR) =TRUE 。 我 们 从 整个 区 域 开始 。 如 果 OCR) = FALSE, 
那么 将 该 图 像 分 割 为 4 个 象限 区 域 如 果 对 于 每 个 象限 区 域 0 为 FALSE, 则 将 该 象限 区 域 再 次 细 分 为 四 
个 子 象限 区 域 ， 以 此 类 推 。 这 种 特殊 的 分 裂 技术 有 一 种 方便 的 表示 方法 ， 即 用 所 谓 的 四 又 树 形式 表示 ， 
也 就 是 每 个 节点 都 正好 有 4 个 后 代 , 如 图 10.52 所 示 (对 应 一 个 四 又 树 的 节点 的 图 像 有 时 称 为 四 分 区 域 或 
四 分 图 像 ) 。 注 意 ， 树 根 对 应 于 整 幅 图 像 ， 而 每 个 节点 对 应 于 该 节点 的 4 个 细 分 子 节点 。 在 这 种 情况 下 ， 
仅 RR 被 进一步 细 分 。 F- 

如 果 只 使 用 分 裂 , 那么 最 后 的 分 区 通常 包含 具有 相同 性 质 的 邻接 | 关于 区 域 相 邻 的 讨论 ， 请 
区 域 。 这 种 缺陷 可 以 通过 人 允许 聚合 和 分 裂 得 到 补救 。 要 满足 10.1 节 中 | 252 节 。 
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提出 的 分 割 约束 条 件 ， 仅 要 求 聚合 满足 属性 O 的 组 合 像素 的 邻接 区 域 。 也 就 是 说 ， 只 有 在 


O(R; UR,)= TRUE 时 ， 两 个 邻接 区 域 及 和 Ri 才能 聚合 。 


cz) $ 


图 10.52 (a) 被 分 割 的 图 像 ;(b) 对 应 的 四 又 树 。R 表示 整个 图 像 区 域 
前 述 讨论 可 以 小 结 为 如 下 过 程 ， 在 该 过 程 的 任何 一 步 中 ,我 们 


1. 把 满足 QO(R)=FALSE 的 任何 区 域 R 分裂 为 4 个 不 相交 的 象限 区 域 。 
2. 不 可 能 进一步 分 裂 时 ， 对 满足 条 件 Q(RjUR)=TRUE 的 任意 两 个 邻接 区 域 玉 和 及 进行 聚合 。 
3. 无 法 进一步 聚合 时 ， 停 止 操作 。 


习惯 上 要 规定 一 个 不 能 再 进一步 执行 分 裂 的 最 小 四 象限 区 的 尺寸 。 

前 述 的 基本 原理 可 能 有 多 种 变化 。 例如 , 在 步骤 2 中 , 如果 两 个 邻接 的 区 域 RB 和 慷 各 自 都 满足 属 
性 ， 则 我 们 允许 聚合 这 两 个 区 域 会 得 到 有 意义 的 简化 。 这 将 导致 简单 得 多 ( 且 快 得 多 ) 的 算法 ， 因 为 属 
性 的 测试 被 限制 在 各 个 四 分 区 域内 。 正 如 下 例 所 示 ， 这 种 简化 仍 能 产生 较 好 的 分 割 结 果 。 


例 10.24 ”用 区 域 分 裂 和 聚合 进行 分 割 。 

图 10.53 (a) 显示 了 天 牧 星 座 环 的 一 幅 大 小 为 566x566 的 射线 波段 图 像 -这 个 例子 的 目 的 是 把 围绕 致 
密 中 心 的 不 太 密 集 的 环 状 物 质 的 图 像 分 割 出 来 。 感 兴趣 区 域 有 一 些 有 助 于 分 割 的 明显 特征 。 首 先 ， 我 们 注 
意 到 该 区 域 中 的 数据 具有 随机 性 质 ， 这 表明 其 标准 差 应 大 于 背景 和 较 大 的 平滑 中 心 区 域 的 标准 差 (背景 的 
标准 差 近 于 0) 。 类 似 地 , 来 自 外 环 的 包含 数据 的 一 个 区 域 的 均值 CES BA AE ys 
较 大 且 明 亮 中 心 区 域 的 均值 。 因 此 ， 我 们 应 该 能 够 用 下 面 的 属性 分 割 感 兴趣 的 区 域 ， 

_{ TRUE, o>aH0<m<b 
me tenes ”其 他 


式 中 ,m Blo 是 一 个 四 象限 区 域 中 的 像素 的 均值 和 标准 差 ， a 和 5 为 常数 。 

对 感 兴趣 外 部 区 域 中 的 几 个 区 域 的 分 析 表明 ， 这 些 区 域 中 的 像素 的 平均 灰 度 未 超过 125， 而 标准 差 总 
是 大 于 10- 图 10.53 (b) 8 (d) 显示 了 对 a 和 b 使 用 这 些 值 和 四 象限 区 域 的 最 小 尺寸 从 32 变 到 8 得 到 的 结果 。 
一 个 四 象限 区 域 中 满足 属性 的 像素 置 为 白色 ， 而 该 区 域 中 的 其 他 像素 则 置 为 黑色 。 根 据 截 获 的 外 部 区 域 形 
状 , 最 好 的 结果 是 使 用 大 小 为 16x16 的 四 象限 区 域 得 到 的 。 图 10.53 (d) 中 的 黑色 方块 是 大 小 为 8x8 的 四 象 
限 区 域 ， 该 区 域 中 的 像素 不 满足 属性 。 使 用 较 小 的 四 象限 区 域 将 导致 此 类 黑色 区 域 数量 的 增加 。 使 用 比 此 
处 说 明 的 大 区 域 会 导致 更 多 “类 似 块 ”的 分 割 。 注 意 ， 在 所 有 情况 下 ， 分 割 后 的 区 域 (白色 像素 ) 从 背景 中 
完全 分 隔 了 平滑 的 内 部 区 域 。 这 样 ， 分割 就 有 效 地 把 图 像 分 成 了 三 个 明显 的 区 域 , 这 些 区 域 对 应 于 图 像 中 
的 三 个 主要 特征 : 背景 、 密 集 区域 和 稀疏 区 域 。 若 使 用 图 10.53 中 的 任何 一 个 白色 区 域 作为 模板 ,会 使 得 
从 原 图 像 中 提取 这 些 区 域 很 简单 (见习 是 10.40) 。 如 例 10.23 中 那样 ， 使 用 基于 边缘 或 闷 值 的 分 割 不 可 能 得 
到 这 些 结果 。 
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图 10.53 (a) NASA IRAE TE X PR BGAR FAG ESENE ERER; (b) ~(d) 分 别 将 允许 
的 最 小 四 象限 区 域 尺寸 限制 为 32x32, 16x16 和 8x8 像素 时 得 到 的 结果 ( 原 图 像 由 NASA 提供 ) 


如 前 面 例 子 中 所 用 的 那样 ， 基 于 一 个 区 域内 像素 灰 度 的 均值 和 标准 差 的 特性 , 试图 量化 该 区 域 的 纹 
H (关于 纹理 的 讨论 ， 见 11.3.3 49). 纹理 分 割 的 概念 是 以 在 属性 上 使 用 纹理 测度 为 基础 的 。 换 名 话说， 
我 们 可 以 使 用 本 节 讨 论 的 任何 一 种 方法 ， 用 指定 基于 纹理 内 容 的 属性 简单 地 执行 纹理 分 割 。 


10.5 用 形态 学 分 水 岭 的 分 割 


迄今 为 止 , 我 们 已 经 讨论 了 基于 三 种 主要 的 分 割 : (a) 边 缘 检测 ，(b) 浆 值 处 理 和 (ec) 区 域 生长 。 每 
种 方法 都 有 其 优点 (例如 全 局 国 值 处 理 具有 速度 优势 ) 和 缺点 (例如 ， 在 基于 边缘 的 分 割 中 ， 需 要 进行 后 
处 理 ， 如 边缘 连接 )s 本 节 讨 论 基于 形态 学 分 水 岭 概念 的 方法 。 在 下 面 的 讨论 中 ， 形 态 学 分 水 岭 分 割 将 
其 他 三 种 方法 中 的 许多 概念 进行 了 具体 化 ， 因 此 通常 会 产生 更 稳定 的 分 割 结 果 ， 包 括 连接 的 分 割 边界 。 
这 科 方 法 为 在 分 割 中 结合 基于 知识 的 约束 提供 了 一 个 简单 的 框架 ， 


10.5.1 背景 知识 


分 水 岭 的 概念 是 以 三 维 方式 来 形象 化 一 幅 图 像 为 基础 的 : 两 个 空间 坐标 作为 灰 度 的 函数 ， 如 
图 2.18(a) 所 示 s 在 这 种 “地 形 学 ”解释 中 ， 我 们 考虑 三 种 类 型 的 点 : (a) 属于 一 个 区 域 最 小 值 的 
A; (b) 把 一 点 视 为 一 个 水 滴 ， 如 果 把 这 些 点 放 在 任意 位 置 上 ， 水 滴 一 定 会 下 落 到 某 个 最 小 值 点 ; 
(0c) 处 在 该 点 的 水 会 等 概率 地 流向 不 止 一 个 这 样 的 最 小 值 点 。 对 于 一 个 特定 的 区 域 最 小 值 ， 满 足 条 
件 (b) 的 点 的 集合 称 为 该 最 小 值 的 汇 水 盆地 或 分 水 岭 。 满 足 条 件 (c) 的 点 形成 地 面 的 峰 线 ， 它 称 为 
分 割 线 或 分 水 线 。 

基于 这 些 概念 的 分 割 算法 的 主要 目标 是 找 出 分 水 线 ， 其 基本 思想 非常 简单 ， 如 下 面 类 似 的 说 明 那 
样 。 假 设 在 每 个 区 域 的 最 小 值 上 打 一 个 洞 ， 并 且 让 水 通过 洞 以 均匀 的 速率 上 升 ， 从 低 到 高 淹没 整个 地 
形 。 当 不 同 汇 水 盆地 中 上 升 的 水 聚集 时 ， 修 建 一 个 水 坝 来 阻止 这 种 聚合 。 水 将 达到 在 水 线 上 只 能 见 到 
各 个 水 坝 的 顶部 的 程度 。 这 些 大 坝 的 边界 对 应 于 分 水 岭 的 分 割 线 。 因 此 ,它们 是 由 分 水 岭 算 法 提取 出 
来 的 (连接 的 ) 边 界 。 

借助 于 图 10.54， 我 们 可 以 进一步 解释 这 些 概念 。 图 10.54(a) 显示 了 一 幅 灰 度 图 像 ， 图 10.54(b) 是 
一 幅 地 形 俯 视图， 其 中 “山峰 ”的 高 度 与 输入 图 像 中 的 灰 度 值 成 正比 。 为 便于 解释 ， 这些 结构 的 背面 
已 被 遮蔽 ， 以 便 不 会 与 灰 度 值 混淆 ， 因 为 我 们 只 对 三 维 表 示 的 普通 地 形 感 兴趣 。 为 了 阻止 上 升 的 水 从 
图 像 的 边缘 溢出 ， 我 们 可 以 想象 整个 地 形 (图 像 ) 的 四 周 已 被 比 最 高 山峰 更 高 的 水 坝 包围 ， 最 高 山峰 的 
值 是 由 输入 图 像 灰 度 级 可 能 具有 的 最 大 值 决 定 的 。 

假设 在 每 个 区 域 的 最 小 值 处 打 一 个 洞 [如 图 10.54 (b) 中 的 深 色 区 域 所 示 ]， 并 让 水 以 均匀 的 速率 上 升 ， 
从 低 到 高 淹没 整个 地 形 。 图 10.54 (c) 说 明了 被 水 淹没 的 第 一 个 阶段 ， 其 中 显示 为 浅 灰 色 的 “水 ” 仅 覆 盖 了 
图 像 中 相对 较 暗 的 背景 区 域 。 在 图 10.54 (d) 和 (e) 中 , 我 们 看 到 水 现在 已 分 别 上 升 至 第 一 个 和 第 二 个 
汇 水 盆地 。 当 水 继续 上 升 时 ,最终 会 从 一 个 汇 水 盆地 溢出 到 男 一 个 汇 水 盆地 ,第 一 个 征兆 如 图 10.54 (P) (293 
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所 示 。 这 里 ， 水 实际 上 从 左 侧 贫 地 溢出 到 了 右 侧 的 盆地 ， 因 此 构筑 了 一 个 较 短 的 “水 坝 ” (由 几 个 像素 组 


成 ) 来 阻止 水 在 这 一 水 位 汇合 (构筑 水 坝 的 细节 将 在 下 一 节 讨 论 ) 。 随 着 水 位 的 不 断 拾 升 ， 更 加 明显 的 效果 
如 图 10.54(g) 所 示 。 这 幅 图 在 两 个 汇 水 盆地 之 间 显 示 了 一 条 更 长 的 坝 ， 另 一 条 水 坝 在 右 侧 盆地 的 顶部 。 

构筑 后 一 水 坝 的 目的 是 ， 阻 止 来 自 盆 地 中 的 水 与 来 自 对 应 背景 中 的 水 的 汇聚 。 持 续 该 过 程 ， 直 到 达到 水 
的 最 高 水 位 (对 应 于 图 像 中 的 最 高 灰 度 值 ) 。 最 终 的 水 坝 对 应 于 分 水 线 ， 这 些 分 水 线 就 是 我 们 和 希望 的 分 割 
结果 。 在 图 10.54 hb) 中 ,该 例 的 结果 显示 为 侄 加 到 原 图 像 之 上 的 一 条 1 像素 宽 的 深 色 路 径 。 注 意 ， 一 条 
重要 的 性 质 就 是 分 水 线 组 成 一 条 连通 的 路 径 ， 这 样 ， 在 两 个 区 域 则 就 给 出 了 连续 的 边界 . 
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图 10.54 (a) 原 图 像 ; b) 地 形 俯视 图 ; (c)~(d) 被 水 淹没 的 两 个 阶段 ; (e) 进一步 淹没 的 结果 ; (DKA 
两 个 汇 水 盆地 的 水 开始 汇聚 (两 个 汇 水 盆地 之 间 构 筑 了 一 个 较 短 的 水 坝 ) ;，(g) 较 长 的 水 坝 ; 
人) 最 终 的 分 水 (GP) Be EMRE CMM/Ecole des Mines de Paris 公司 的 S. Beucher 博士 提供 ) 


分 水 岭 分 割 的 主要 应 用 之 一 是 ， 从 背景 中 提取 近乎 一 致 类 似 于 水 滴 ) 的 物体 。 由 变化 较 小 的 灰 度 表 
征 的 区 域 有 较 小 的 梯度 值 。 因 此 ， 我 们 经 常见 到 分 水 岭 分 割 方法 用 于 一 幅 图 像 的 梯度 ， 而 不 是 图 像 本 
身 。 有 了 这 一 表示 法 ， 汇 水 盆地 的 区 域 最 小 值 就 可 很 好 地 与 对 应 于 感 兴趣 物体 的 较 小 梯度 值 联系 起 来 


10.5.2 “水坝 构建 


在 讨论 之 前 ， 让 我 们 考虑 一 下 如 何 构建 分 水 岭 分 割 算 法 所 需 的 水 坝 或 分 水 线 。 水 坝 的 构造 是 以 二 
值 图 像 为 基础 的 ， 这 种 图 像 是 二 维 整数 空间 Z 的 成 员 ( 见 2.4.2 节 ) 。 构 建 分 离 二 元 点 集 的 水 坝 的 最 简 
方法 是 ， 使 用 形态 学 膨胀 ( 见 9.2.2 节 ) 。 

图 10.55 说 明了 如 何 使 用 形态 学 膨胀 来 构建 水 坝 的 基础 。 图 10.55 (a) 显示 了 第 n-1 步 淹没 的 两 个 
汇 水 盆地 。 图 10.55 (b) 显示 了 第 即 步 淹没 的 结果 。 水 已 从 一 个 盆地 溢出 到 了 另 一 个 盆地 ， 因 此 必须 构 
建 水 坝 来 阻止 这 种 情况 的 发 生 。 为 了 与 很 快 将 要 引入 的 符号 一 致 ， 令 Mi 和 M RAN aE A 
小 值 点 坐标 的 集合 。 然 后 , 将 汇 水 盆地 中 点 的 坐标 集合 与 这 两 个 在 洪 出 的 第 2- 1 步 处 的 最 小 值 点 的 
坐标 集合 联系 起 来 ,在 第 ”- 1 步 溢出 处 ,两 个 最 小 值 分 别 表 示 为 Cra (MYA CD)。 它 们 是 图 10.55 (a) 
中 的 两 个 灰色 区 域 。 

令 CIn 一 1] 表 示 这 两 个 集合 的 并 集 。 图 10.55 (a) 中 有 两 个 连通 分 量 (关于 连通 分 量 的 讨论 , 见 2.5.2 节 )， 
而 图 10.55 (b) 中 只 有 一 个 连通 分 量 ， 该 连通 分 量 包含 了 如 虚线 所 示 的 前 两 个 分 量 。 两 个 连通 分 量变 成 
一 个 连通 分 量 的 事实 表明 ， 两 个 汇 水 盆地 在 第 n 步 淹 没 中 已 被 聚合 。 令 q 表示 这 个 连通 分 量 。 注 意 ， 
HA n- 步 的 两 个 连通 分 量 可 以 使 用 简单 的 “与 ”操作 (gm Cln 一 1]) 从 gq 中 提取 。 我 们 还 注意 到 ， 属 
于 单个 汇 水 盆地 的 所 有 点 形成 了 单个 连通 分 量 。 
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假设 图 10.55 (a) 中 的 每 个 连通 分 量 被 图 10.55 (c) 中 所 示 结 构 元 膨胀 满足 两 个 条 件 : (1) 膨胀 必须 受 


到 g 约束 (这 意味 着 在 膨胀 的 过 程 中 , 结构 元 的 中 心 只 能 位 于 4 中 的 点 处 ) (2) 不 能 对 会 引起 正 被 膨胀 
集合 聚合 ( 变 成 单个 连通 分 量 ) 的 那些 点 执行 膨胀 。 图 10.55 (d) 表明 ， 第 一 轮 膨 胀 (显示 为 浅 灰 色 ) 展开 
了 每 个 原始 连通 分 量 的 边界 。 注 意 ， 膨 胀 过 程 中 ， 每 个 点 都 满足 条 件 (1) ， 而 在 膨胀 处 理 中 ， 条 件 (2) 
未 应 用 于 任何 点 ; 这 样 ， 就 均匀 扩展 了 每 个 区 域 的 边界 。 


ag 


T i E 第 一 次 膨胀 
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tl E awk 
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图 10.55 ” (a) 第 n-1 步 淹没 处 ， 两 个 部 分 淹没 的 汇 水 倪 地 ; (b) 在 淹没 的 第 nn 步 处 ， 显 
示 水 已 在 两 个 盆地 间 浇 出 ; (c) 用 于 膨胀 的 结构 元 ; (d) 膨胀 结果 和 水 坝 构建 


在 第 二 轮 膨 胀 中 (显示 为 黑色 ) ， 几 个 不 符合 条 件 (1) 的 点 却 符合 条 件 (2) ， 这 导致 了 图 中 所 示 的 断 开 
周 界 。 很 明显 ，9 中 只 有 满足 上 述 两 个 条 件 的 点 ， 才 能 描绘 出 图 10.55 (d) 中 由 又 线 所 示 的 1 像素 宽 的 连 
通路 径 。 在 淹没 的 第 n 步 , 这 条 路 径 构 成 了 所 期 望 的 分 隔 水 坝 。 在 这 一 淹没 水 平 上 的 水 坝 构 建 ， 是 在 刚 
刚 确定 的 这 条 路 径 上 的 所 有 点 设置 一 个 大 于 图 像 最 大 灰 度 值 的 值 来 完成 的 。 所 有 水 坝 的 高 度 通 常设 置 为 
1 加 上 图 像 中 允许 的 最 大 灰 度 值 。 水 位 升 高 时 ， 这 样 设置 可 以 阻止 洪水 漫 过 所 完成 的 水 坝 。 注 意 ， 通 过 
这 一 过 程 构建 的 水 坝 是 连通 分 量 很 重要 , 它 就 是 我 们 希望 得 到 的 分 制 边界 。 换 句 话 说 , 这 种 方法 消除 了 
分 割 线 断裂 的 问题 。 

尽管 刚刚 描述 的 过 程 只 是 基于 一 个 简单 的 例子 ， 但 该 方法 同样 适用 于 更 为 复杂 的 情形 ， 包 括 使 用 
图 10.55 (c) 中 所 示 的 3x3 对 称 结构 元 。 


10.5.3 “分水岭 分 割 算法 


令 Mi, My,… ,Ma 是 图 像 g(x,») 中 区 域 最 小 值 点 的 坐标 集 。 如 同 在 10.5.1 节 末 尾 说 明 的 那样 ,这 是 
一 幅 典 型 的 梯度 图 像 。 令 C(M) 是 与 区 域 最 小 值 Mi 相关 的 汇 水 盆地 中 的 点 的 坐标 集 ( 回 忆 任何 汇 水 盆地 
中 的 点 都 形成 一 个 连通 分 量 ) 。 符 号 min 和 max 表示 g(x, 人 的 最 小 值 和 最 大 值 。 最 后 , 令 7[m] 表 示 满 足 
g(s, 1) <n 的 坐标 (s, ?) 的 集合 ， 即 









TIn]={(s,D)|g(s,t) <n} (10.5-1) 
JUL, Tne g(x,y) 中 位 于 平面 g(x, y) =n 下方 的 点 的 坐标 集 。 

随 着 水 位 以 整数 从 n=min+1 到 n=max+ 1 不断 上 升 , 地 形 将 被 水 淹没 。 在 淹没 过 程 的 任意 步 
n, 算法 都 需要 知道 处 在 淹没 深度 之 下 的 点 的 数量 。 从 概念 上 讲 , 假设 处 在 g(x, y)=n 平 面 之 下 的 Tin] 
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中 的 坐标 被 “标记 ”为 黑色 ， 所 有 其 他 坐标 被 标记 为 白色 。 人 然后 ， 当 我 们 以 任何 淹没 增 量 n 癌 下 观察 
xy Fmt, 我们 将 会 看 到 一 幅 二 值 图 像 ， 图 像 中 的 黑 点 对 应 于 函数 中 平面 g(x, y) = nn 之 下 的 点 。 这 种 
解释 对 于 理解 下 面 的 讨论 很 有 帮助 。 

令 C,(0M,) 表 示 汇 水 盆地 中 与 淹没 阶段 天 的 最 小 值 M; 相 关联 的 点 的 坐标 集 。 机 入 
Ril, C,(M,) 可 视 为 由 下 式 给 出 的 一 幅 二 值 图 像 : 

Cy(M,)=C(M,)NT[n] (10.5-2) 

换 名 话说， 如果 (x, y)EC(M) 和 (x, y)ET[n] 相 “与 "， 则 在 位 置 (x, y) 处 有 Cn(M) =1。， 否 则 CaM) = 0. 
这 一 结果 的 几何 解释 很 简单 ， 我 们 在 淹没 阶段 a 只 需 使 用 “与 ”(AND) 算 子 将 7[n] 中 的 二 值 图 像 分 离 
出 来 即 可 。 | 

FE, RITS CIn] 表 示 阶 段 n 中 已 被 水 淹没 的 汇 水 倪 地 的 “SP”: 


R 
Cln]=( JC, 7) (10.5-3) 
i=l 
然后 ， 令 CImax + 1] 表 示 所 有 汇 水 盆地 的 “并 ”: 
R 
C{max+1]=|_JC(m;) (10.5-4) 


i=l 


可 以 证 明 ( 见 习题 10.41) , 在 算法 的 执行 过 程 中 , CMAN 了 [四 中 的 元 素 是 不 会 被 蔡 换 的 , 而 且 当 增 大 时 ， 
这 两 个 集合 中 的 元 素 的 数量 不 是 增加 ， 就 是 保持 相同 。 这 样 ， 可 认为 C[n 一 1] 就 是 C[n] 的 一 个 于 集 。 根 据 
式 (10.5-2) 和 式 (10.5-3) 可知 ，C[n] 是 7T[n] 的 一 个 子 集 ， 所 以 ，C[n 一 1] 可 以 理解 为 7T[n] 的 一 个 子 集 。 由 此 ， 
我 们 得 出 一 个 重要 的 结果 : C[n 一 1] 中 的 每 个 连通 分 量 都 恰好 包含 在 7[n] 的 一 个 连通 分 量 中 。 

寻找 分 水 线 的 算法 使 用 C[min +1]=T [min + 1] 来 初始 化 ,然后 , 该 算法 进行 递归 处 理 , 由 Cin- 1] 
计算 Cin] 由 C[n-1] 求 得 C[n] 的 过 程 如 下 : 令 QQ 表示 TIn] 中 的 连通 分 量 的 集合 。 然 后 ,对 于 每 个 连 
通 分 量 ge O[n]， 有 如 下 三 种 可 能 性 : 


t. gNC[n-1] A288. 
2. gn Cl[n-1] 包 含 C[n-1] 的 一 个 连通 分 量 。 
3. gn Cf[n-1] 包 含 C[n-1] 的 一 个 以 上 的 连通 分 量 。 


由 C[n-1] 构 建 Clm] 取 决 于 这 三 个 条 件 中 的 哪个 条 件 成 立 。 遇 到 一 个 新 的 最 小 值 时 ， 条件 1 发 生 ， 
这 种 情况 下 ， 连 通 分 量 g 并 入 C [n 1] 中 形成 C[n]。 当 gq 位 于 某 些 局 部 最 小 值 的 汇 水 盆地 内 时 ， 条件 - 
2 发生, 这 种 情况 下 , q 并 入 C[n 一 1 中 形成 C[n]。 当 直到 全 部 或 部 分 分 隔 两 个 或 多 个 汇 水 倪 地 的 山 珍 
线 时 , 条 件 3 发 生 。 进一步 淹没 会 导致 这 些 汇 水 盆地 中 的 水 位 聚合 。 因此 , 必须 在 q 内 构筑 一 个 水 坝 ( 如 
果 涉 及 两 个 以 上 的 汇 水 盆地 ， 就 要 构筑 多 个 水 坝 ) 以 阻止 汇 水 盆地 间 的 水 溢出 。 如 前 节 中 解释 的 那样 ， 
当 我 们 使 用 元 素 为 1、 大 小 为 3x3 的 结构 元 来 膨胀 gn C [n 一 1] 且 膨胀 被 限制 到 gq 时， 可 以 构建 一 座 1 
像素 宽 的 水 坝 。 

仅 用 g(x, ») 中 对 应 于 现 有 灰 度 值 的 值 就 可 改善 算法 的 效率 ; 根据 g(x, y) 的 直方 图 ， 我 们 可 以 确 
定 这 些 值 ， 以 及 最 小 值 和 最 大 值 。 


例 10.25 E 1036) MO HARIR 
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图 10.56 ”(a) 水 滴 的 图 像 ; (b) 图 像 的 梯度 ; (c) 分 水 线 ; (d) 肆 加 在 原 图 像 上 的 分 水 线 
( 原 图 像 由 CMM/Ecole des Mines de Paris 公司 的 S. Beucher 博士 提供 ) 


10.5.4 ”标记 的 使 用 


直接 应 用 前 一 节 讨 论 的 分 水 岭 分 割 算法 ， 通 常会 由 于 噪声 和 梯度 的 其 他 局 部 不 规则 性 造成 过 度 分 
割 ， 如 图 10.57 所 示 ， 过 度 分 割 的 严重 性 足以 令 算法 得 到 的 结果 变 得 毫 无 用 处 。 在 这 种 情况 下 ， 这 意 
味 着 存在 大 量 的 分 割 区 域 。 实 际 解决 该 问题 的 一 种 方案 是 ， 通 过 融和 人 预 处 理 步 又 来 限制 允许 存在 的 区 
域 的 数量 ， 而 预 处 理 步 又 是 指 将 附加 知识 应 用 于 分 割 过 程 。 

用 于 控制 过 度 分 割 的 一 种 方法 基于 标记 这 一 概念 。 标 记 是 指 属于 一 幅 图 像 的 连通 分 量 。 与 感 兴趣 物 
体 相 联系 的 标记 称 为 内 部 标记 ， 与 背景 相关 联 的 标记 称 为 外 部 标记 。 选 择 标记 的 典型 过 程 由 两 个 主要 步 
又 组 成 : (DD) 预 处 理 ; (2) 定义 标记 必须 满足 的 一 个 准则 集合 。 为 了 对 此 进行 说 明 ， 再 次 考虑 图 10.57(a) 。 
导致 图 10.57 (b) 中 过 度 分 割 结果 的 部 分 原因 是 ， 存 在 大 量 潜在 的 最 小 值 。 由 于 它们 的 尺寸 ， 许 多 最 小 值 是 
不 相关 的 细节 。 就 像 先前 的 讨论 中 多 次 指出 的 那样 ， 将 很 小 的 空间 细节 的 影响 降 至 最 低 的 有 效 方法 是 ， 
用 一 个 平滑 滤波 器 对 图 像 进行 过 滤 。 在 这 种 特殊 情况 下 ， 这 是 一 种 合适 的 预 处 理 方 案 。 


a'b 





图 10.57 (a) 电泳 现象 图 像 ;，(b) 对 梯度 图 像 应 用 分 水 岭 分 割 算法 得 到 的 结果 。 过 度 分 割 现象 
很 明显 ( 原 图 像 由 CMM/Ecole des Mines de Paris 公司 的 S. Beucher 博士 提供 ) 


假设 我 们 将 内 部 标记 定义 为 ，(1) 被 更 高 “海拔 ”点 包围 的 区 域 ，(2) 区 域 中 形成 一 个 连通 分 量 的 
那些 点 ; (3) 连通 分 量 中 所 有 的 点 有 相同 的 灰 度 值 。 在 图 像 经 过 平滑 处 理 之 后 ， 由 该 定义 导致 的 内 部 标 
记 在 图 10.58 (a) 中 以 浅 灰 色 、 斑 点 状 区 域 显 示 。 接着， 在 这 些 内 部 标记 只 能 是 在 允许 区 域 最 小 值 的 限 
制 下 ， 对 平滑 后 的 图 像 应 用 分 水 岭 算 法 。 图 10.58 (a) 显示 了 得 到 的 分 水 线 。 将 这 些 分 水 线 定义 为 外 部 
标记 。 请 注意 ， 沿 分 水 线 的 点 经 过 相 邻 标记 间 的 最 高 点 。 

图 10.58 (a) 中 的 外 部 标记 有 效 地 将 图 像 分 割 成 了 不 同 的 区 域 ， 每 个 区 域 都 包含 一 个 内 部 标记 
和 部 分 背景 。 这 样 ， 问 题 就 简化 为 将 每 个 区 域 划 分 为 两 部 分 ， 单个 物体 及 其 背景 。 我 们 可 以 根据 
这 一 简化 过 的 问题 ， 应 用 多 种 在 本 章 先前 讨论 过 的 分 割 技术 。 另 一 种 方法 是 ， 对 各 个 区 域 简单 地 [98 
应 用 分 水 岭 分 割 算 法 。 换 名 话说, 我 们 简单 地 求 得 平滑 后 图 像 的 梯度 [ 见 如 图 10.56 (b) ]， 然 后 将 
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算法 限制 在 只 对 在 该 特殊 区 域 中 包含 这 一 标记 的 单一 分 水 岭 进 行 操作 。 使 用 这 种 方法 得 到 的 结果 
如 图 10.58(b) 所 示 。 相 对 于 图 10.57 (b) ， 改 善 很 明显 。 






ds oe / yi h 2 s a PA ~ 
图 10.58 (a) 显示 有 内 部 标记 ( 浅 灰色 区 域 ) 和 外 部 标记 (分 水 线 ) 的 图 像 ，(b) 分 割 的 结果 。 注 意 ,注意 其 相对 
于 图 10.47 (b) 的 改进 。( 原 图 像 由 CMM/Ecole des Mines de Paris 公司 的 S. Beucher 博士 提供 ) 


标记 的 选择 可 以 用 基于 灰 度 值 和 连通 性 的 简单 过 程 归 类 ， 如 刚才 所 说 明 的 那样 ， 更 复杂 的 描述 涉 
及 尺寸 、 形 状 、 位 置 、 相 对 距离 、 纹 理 内 容 等 ( 见 第 11 章 中 关于 描绘 子 的 内 容 ) 。 关 键 是 使 用 标记 带 来 
的 与 分 割 问题 有 关 的 先 验 知识 。 应 该 提醒 读者 注意 的 是 : 人 类 经 常 以 先 验 知识 用 日 常 的 视觉 辅助 进行 
各 种 分 割 和 更 高 级 的 工作 ， 最 熟悉 的 例子 之 一 就 是 上 下 文 的 使 用 。 因 此 ， 分 水 岭 分 割 方法 提供 了 一 种 
能 有 效 使 用 这 类 知识 的 框架 ， 这 是 这 种 方法 的 一 个 突出 优点 。 


10.6 分割 中 运动 的 应 用 


运动 是 人 类 和 其 他 任何 动物 从 无 关 细节 背景 中 提取 感 兴趣 物体 或 区 域 的 强大 提示 。 在 成 像 应 用 
中 ， 运 动 来 自 感觉 系统 和 正 被 观看 场景 间 的 相对 位 移 ， 比 如 机 器 人 应 用 、 自 主导 航 和 动态 场景 分 析 。 
在 下 面 的 几 节 中 ,我 们 将 考虑 运动 在 空间 域 和 频率 域 分 割 中 的 运用 。 


10.6.1 空间 域 技术 

基本 方法 

分 别 检测 在 时 刻 4 和 获取 的 两 帧 图 像 f(x,y, 加 和 了,y, 信 之 间 的 变化 的 最 简 方 法 之 一 是 , 逐 像素 
地 比较 这 两 幅 图 像 。 这 样 做 的 的 目的 是 形成 一 幅 差 值 图 像 。 假 设 我 们 有 一 幅 仅 包含 固定 成 分 的 参考 图 
像 。 将 这 幅 图 像 和 一 幅 后 续 有 着 相同 场景 但 包含 一 个 运动 物体 的 图 像 进 行 比 较 ， 去 掉 两 幅 图 像 中 的 固 


定 元 素 ， 仅 保留 对 应 于 非 固定 图 像 成 分 的 非 零 项 ， 就 可 得 到 两 幅 图 像 的 差 。 
在 时 刻 志和 上 获取 的 两 幅 图 像 间 的 差 值 图 像 定义 为 


l, | f(x, y, t= f(x, y, t,)|>T 
0， 其 他 


AP, T 是 一 个 指定 的 交 值 。 注 意 ， 就 像 由 该 指定 阔 值 确定 的 那样 ， 仅 当 两 幅 图 像 间 的 灰 度 差 在 空间 
坐标 (x, yy) 处 明显 不 同时 ，dy(x, ») 在 该 坐标 处 的 值 才 为 1。 假 设 所 有 图 像 的 大 小 相同 。 最 后 ， 我 们 注意 
到 ， 式 (10.6-1) 中 坐标 (x, y) 的 值 跨越 了 这 些 图 像 的 维度 ， 所 以 差 值 图 像 dj(x, y) 与 序列 中 其 他 图 像 的 大 
小 相同 。 

在 动态 图 像 处 理 中 ，dj(x, ») 中 值 为 1 的 所 有 像素 被 认为 是 物体 运动 的 结果 。 这 种 方法 只 有 在 两 幅 图 
B01) 像 都 做 了 空间 配 准 且 在 7 值 设 定 的 范围 内 光照 相对 恒定 的 情况 下 才 是 可 用 的 。 实 际 上 ，4d;(x, 力 中 的 1 值 


d,(x, »-| (10.6-1) 
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项 可 能 是 由 噪声 造成 的 。 通 常 ， 在 差 值 图 像 中 这 些 项 是 孤立 的 点 ， 去 除 它 们 的 一 种 简单 方法 是 , 在 dy (x, 
力 中 构成 由 1 组 成 的 4 连通 或 8 连通 区 域 ， 然 后 忽略 1 值 项 少 于 预定 元 素数 量 的 任何 区 域 尽管 这 种 
F 法 会 忽略 掉 小 的 和 /或 慢 速 运动 的 物体 ,但 它 改 善 了 差 值 图 像 中 剩余 项 实际 是 运动 结果 的 机 会 


累积 差 值 
考虑 一 个 图 像 帧 序列 了 f(x,y, 国 ), S y bs Sf Os th), 令 了 (x,y,t) 为 参考 图 像 。 一 幅 累 积 差 值 图 像 
(ADI) 是 通过 将 参考 图 像 与 序列 : 每 由 后 续 图 像 进行 比较 形成 的 当 参 考 图 像 和 序列 中 一 幅 图 像 之 间 


在 某 个 像素 位 置 上 出 现 一 次 差异 时 ， 累 积 图 像 中 每 个 像素 位 置 的 计数 器 计数 一 次 。 因 此 ， 当 第 磊 帧 图 
像 与 参考 图 像 进行 比较 时 ， 累 积 图 像 中 一 个 给 定 像素 的 输入 项 ， 会 给 出 在 此 位 置 上 灰 度 与 参考 图 像 相 
应 的 像素 值 不 同 的 次 数 [ 如 由 式 (10.6-1) 中 的 了 确定 的 那样 ]。 

考虑 如 下 累积 差 值 图 像 的 三 种 类 型 : 绝对 ADI, IE ADI 和 负 ADI。 假 设 运 动物 体 的 灰 度 值 大 于 坦 
景 的 灰 度 值 ， 这 三 种 ADI 定义 如 下 。 S RO, 7) 表 示 参 考 图 像 ， 为 简化 符号 ,， 令 大 表示 如 WAS “ele 
fy Ho 我 们 假设 RE, y =E, y, D。 然 后 ， 对 于 任何 他 1， 且 记 住 ADI 的 值 是 计数 ， 我 们 对 (x, y) 的 
所 有 相关 值 定义 如 下 : 


A, (x, y) + l, | R(x, y) * TN, ys k) | > £ 

Ale = 0.6-2 

K(X, y) tole E 其 他 (10.6-2) 
P. (x,y)+1, [R(x,y)— f(x yk T 

et RO A > (10.6-3) 
B (sy) 其 他 

和 
N,_,(x,v)+1, [R(x,y)- f(x, yk -T 
Ge Iy) +l T i y)-f(xy A] < (106-4) 

N,, (x,y), 其 他 


AP, Ae, À, Pex, 妨 和 NGCc 轨 分 别 为 遇 到 序列 中 的 第 磊 幅 图 像 后 的 绝对 ADI, TE ADI 和 负 ADI 

不 难 理解 ， 这 些 ADI AEF oR (计数 ) 。 还 要 注意 这 些 ADI 与 序列 中 的 图 像 大 小 相同 。 最 后 ， 
我 们 =a WR RARE KA ea SAREE, WE (10.6-3) 和 式 (10.6-4) 中 不 等 式 的 顺 
序 和 靖 值 的 符号 是 相反 的 。 


$10.26 绝对、 正和 负 的 累积 差异 图 像 的 计算 。 

图 10.59 显示 了 以 灰 度 图 像 形 式 显示 的 三 种 ADI， 图 中 和 矩形 物体 的 大 小 为 75x50 像素 ， 该 物体 以 每 帧 
5V2 个 像素 的 速度 向 东南 方向 运动 。 图 像 的 大 小 为 256x256 像素 。 我 们 注意 到 下 列 几 点 : (D 正 ADI 的 非 
零 区 域 等 于 运动 物体 的 大 小 。(2) 正 ADI 的 位 置 对 应 于 参考 由 中 运动 物体 的 位 置 。(3) 当 运 动物 体 与 参考 帧 
中 的 同一 物体 完全 被 移动 时 ， 正 ADI 中 的 计数 停止 增加 。(4) 绝 对 ADI 包含 正 ADI A ADI 的 区 域 。(5) 
运动 物体 的 方向 和 速度 可 由 绝对 ADI 和 负 ADI 中 的 输入 决定 。 


abc 


图 10.59 ”一 个 向 东南 方 移动 的 矩形 物体 的 ADI: (a) Xt ADI; (b) IE ADI; (c) fi ADI 





802 


504 数字 图 像 处 理 (第 三 版 ) 


建立 参考 图 像 

前 两 节 讨论 的 技术 取得 成 功 的 关键 是 ， 找 到 一 幅 可 以 与 后 续 图 像 进行 比较 的 参考 图 像 。 在 动态 成 
像 问题 中 ， 两 幅 图 像 的 差 值 倾向 于 消除 图 像 中 的 所 有 固定 成 分 ， 而 只 留 下 对 应 于 噪声 和 运动 物体 的 图 
像 元 素 。 

实际 上 ， 仅 用 固定 元 素 得 到 一 幅 参 考 图 像 并 不 总 是 可 行 的 ， 所 以 有 必要 根据 一 组 包含 一 个 或 多 个 
运动 物体 的 图 像 来 构建 一 幅 参 考 图 像 。 这 尤其 适用 于 描述 变化 频繁 的 场景 或 需要 频繁 更 新 的 场景 的 情 
况 。 生 成 参考 图 像 的 过 程 如 下 所 述 。 考 虑 将 图 像 序列 中 的 第 一 幅 图 像 作为 参考 图 像 。 当 一 个 非 固 定 成 
分 完全 移出 其 参考 帧 的 位 置 时 ， 当 前 帧 中 对 应 的 背景 可 复制 到 最 初 被 参考 帧 中 物体 占据 的 位 置 。 当 所 
有 的 移动 物体 均 已 完全 移出 原来 的 位 置 时 ， 就 创建 了 一 幅 仅 包含 固定 成 分 的 参考 图 像 。 像 前 节 中 说 明 
的 那样 ， 通 过 监视 正 ADI 中 的 变化 ， 可 确定 物体 的 位 移 。 


$10.27 构造 一 幅 参 考 图 像 。 

图 10.60 (a) AI (b) 显示 了 十 字 路 口 的 两 幅 图 像 帧 。 第 一 幅 图 像 作为 参考 图 像 ， 第 二 幅 图 像 描述 了 一 段 
时 间 后 的 同一 场景 。 为 生成 一 幅 静 止 图 像 ， 我们 的 目的 是 去 掉 参 考 图 像 中 的 主要 运动 物体 。 尽 管 存 在 其 他 
绞 小 的 运动 物体 ， 但 主要 的 运动 特征 是 在 十 字 路 口 从 左 到 在 运动 的 汽车 。 为 了 说 明 这 一 目的 ,我 们 将 注意 
力 放 在 这 个 物体 上 。 通过 监视 正 ADI 的 变化 ,如 先前 解释 的 那样 ,可 以 确定 一 个 移动 物体 的 初始 位 置 。 一 
旦 确定 了 被 这 个 物体 占据 的 区 域 , 使 用 减法 可 从 图 像 中 移 除 该 物体 。 通过 观察 图 像 序列 中 正 ADI 停止 变 化 
的 那 一 帧 图 像 ， 我 们 可 以 从 该 幅 图 像 中 复制 先前 被 初始 帧 中 移动 物体 所 占据 的 区 域 。 然 后 ,将 该 区 域 粘贴 
到 被 挖 去 物体 的 图 像 中 ， 从 而 恢复 该 区 域 的 背景 。 如 果 对 所 有 运动 的 物体 都 执行 这 种 操作 ,结果 将 是 一 幅 
只 包含 静止 成 分 的 参考 图 像 ， 针 对 该 参考 图 像 ， 我 们 可 在 运动 检测 中 与 后 续 帧 进行 比较 。 在 这 种 情况 下 ， 
图 10.60 (c) 显示 了 去 掉 向 东 运 动 的 汽车 后 得 到 的 结果 。 





abe ‘ 
图 10.60 构造 一 幅 静 止 参考 图 像 : (a) 和 (b) 序 列 中 的 两 帧 图 像 ;(c) 从 图 (a) 中 减 去 向 东 运 动 
的 汽车 并 使 用 图 (b) 中 的 对 应 区 域 恢 复 背 景 后 的 结果 ( 原 图 像 由 Jain 和 Jain 提供 ) 


10.6.2 ”频率 域 技术 


本 节 考 虑 通过 健 里 叶 变 换 公式 来 确定 运动 的 问题 。 考 虑 一 个 序列 f(x,y, D, t= 1,2,…,K-1， 
该 序列 是 由 一 台 固 定 照相 机 拍摄 的 大 小 为 MXN 的 天 帧 数字 图 像 。 我 们 从 假设 所 有 帧 都 有 零 灰 度 的 
均匀 背景 开始 讨论 。 例 外 是 具有 单位 灰 度 的 1 像素 大 小 的 单个 物体 ， 该 物体 以 恒定 速度 运动 。 假 
设 对 于 第 一 帧 (t = 0)， 物 体 在 位 置 (x y') 处 ， 并 且 将 图 像 平面 投影 到 x 轴 上 ; 也 就 是 说 ， 对 图 像 中 
的 一 列 像素 的 灰 度 相 加 。 这 一 操作 产生 一 个 带 有 M 个 零 值 项 的 一 维 阵列 ， 除 了 交 处 ， 它 是 单 点 物 
(KAY x 坐标。 现在 , 如果 我 们 用 exp[j2rwxA 如 乘 以 一 维 阵 列 中 的 每 个 分 量 , 其 中 x= 1,2,…,M-1， 
并 把 结果 相 加 ,我 们 会 得 到 单项 exp[j2xayx'At] 。 在 这 种 表示 中 ，w 是 一 个 正 整数 ，At 是 不 同 帧 之 
间 的 时 间 间 隔 。 

假设 在 第 二 帧 中 (t= 1), 物体 已 运动 到 坐标 (x'+1, y) 处 ; 也 就 是 说 ， 物 体 在 平行 于 x 轴 的 方 


g04| 向 移动 了 1 像素 的 位 置 。 然 后 ， 重 复 上 一 段 中 提 到 的 投影 过 程 ， 得 到 和 exp[j2xai(x'+1)At] 。 若 物 
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体 每 帧 继续 移动 1 像素 , 则 在 任何 整数 瞬间 t, 结果 为 exp[j2xa(x'+7)A1] ,使 用 欧 拉 公式 ,可 将 它 


表示 为 
eae +94 = cos[2ra (x' + t)At]+ jsin[2na,(x' + t)At] (10.6-5) 


AP, t=0,1,---,K-1, Beat, AARNA a 的 复 正 弦 曲 线 。 如 果 物 体 在 帧 间 移 动 
V RR HE x FW), aaa Viais ws 1 在 0 和 天 -1 之 间 以 整数 增 量变 化 ， 限 制 
a, 只 取 整 数 一 个 位 于 频率 Via 处 ， BTL 
K- Via, 处 。 in 4.6.4 节 中 讨论 的 那样 FV OA, 故 可 以 忽略 。 
因此 ,在 傅 里 时 频谱 中 找到 一 个 波峰 ， 就 得 到 Vao H a 除 该 量 得 到 丰 ， 它 就 是 x 方 向 的 速度 分 量 ， 
这 里 假设 帧 速率 是 已 知 的 。 采 用 类 似 的 方法 可 以 得 到 ?方向 的 速度 分 量 万。 

没有 运动 发 生 的 帧 序列 会 产生 相同 的 指数 项 , 其 傅 里 叶 变 换 在 频率 0 (单个 直流 项 ) 处 有 一 个 波峰 。 
所 以 ， 由 于 迄今 为 止 我 们 讨论 的 都 是 线性 操作 ， 故 在 任意 静止 背景 中 涉及 一 个 或 多 个 运动 物体 的 一 般 
情况 下 ， 对 应 于 静止 图 像 分 量 的 直流 处 ， 传 里 叶 变换 有 一 个 波峰 ， 且 这 些 位 置 的 波峰 与 物体 的 速度 成 
正比 。 

上 述 概念 可 以 总 结 如 下 :; 对 于 由 天 幅 大 小 为 MxN 的 数字 图 像 组 成 的 序列 ， 在 任何 整数 的 瞬时 点 
上 ， 图 像 投影 到 x 轴 上 的 加 权 和 为 





M-1N-1 
g.(t, a)= >, > fl y, De 1=0, 1, +, K=1 (10.6-6) 
x=0 y=0 
类 似 地 ,，y 轴 上 的 投影 和 为 
N-1 M-1 
g(t, )=> > f(xy, DeP™™™ ¢=0, 1, +, K-1 (10.6-7) 
y=0 x=0 


其 中 ， 如 已 经 解释 过 的 那样 ，al 和 a, 都 是 正 整 数 。 
式 (10.6-6) 和 式 (10.6-7) 的 一 维 傅 里 叶 变 换 分 别 为 


K-1 
Gu a) => g,(t, je E wu =0, 1, +: K-1 (10.6-8) 
t=0 
和 
K-1 
G (uz, a)= > g,(t, a,)eP™"* uw, =0, 1, + Kl (10.6-9) 
t=0 
实际 上 ， 如 4.11 节 中 讨论 的 那样 ， 这 些 变换 的 计算 是 使 用 FFT 算法 执行 的 。 
频率 和 速度 的 关系 是 
u =a, (10.6-10) 
和 
u, =a,V, (10.6-11) 


在 该 式 中 , 速度 的 单位 是 像素 数 / 总 帧 时 间 。 例如 , Vi = 10 可 以 解释 为 在 KK 帧 中 物体 运动 了 10 个 像素 。 
对 于 匀速 拍摄 的 图 像 帧 ， 实 际 的 物理 速度 取决 于 帧 速率 和 像素 之 间 的 距离 。 因 此 , 若 万 =10, K=30, 
帧 率 是 两 幅 图 像 / 秒 ， 像素 之 间 的 距离 是 0.5m， 则 x 方向 的 实际 物理 速度 是 
Vi=(10 个 像素 ) (0.5 m/ 像 素 )(2 帧 /s)/(30 Wi) = 1/3 m/s 
速度 的 x 分 量 的 符号 可 通过 计算 下 式 得 到 |: 


805 


806 


506 数字 图 像 处 理 (第 三 版 ) 





六 = Belg. a (10.6-12) 
dt“ bs 
和 
d* In 
So, = ite el a)l (10.6-13) 
t=n 





因为 g. 是 正弦 函数 , 故 可 以 证 明 ( 见 习题 10.47) , RRES VAWE, 则 在 时 间 n, Sy, A S> 在 任意 点 
将 有 相同 的 符号 。 反 之 ，Si. 和 S55. 的 符号 相反 则 表明 速度 分 量 V 为 负 。 如 果 Su 或 Sy, WE. 那么 我 们 
考虑 下 一 个 最 近 的 时 间 点 t=n 土 At 。 类 似 的 说 明 适 用 于 计算 万 的 符号 。 


例 10.28” 通过 频率 域 检测 较 小 的 运动 物体 。 

图 10.61 到 图 10.64 说 明了 刚才 推导 方法 的 有 效 性 。 图 10.61 显示 了 一 组 32 Wi LANDSAT 图 像 序 列 中 
的 一 幅 图 像 , 该 图 像 是 通过 将 白 噪声 添加 到 一 幅 参 考 图 像 中 产生 的 。 图像 序列 中 包含 一 个 到 加 的 运动 物体 ， 
物体 在 x 方 向 以 每 帧 0.5 个 像素 的 速度 运动 ， 在 y 方 向 以 每 帧 1 个 像素 的 速度 运动 。 在 图 10.62 中 用 圆圈 
标 出 的 物体 ,在 展开 的 较 小 (9 像素) 区 域内 呈 高 斯 灰 度 分 布 ， 该 分 布 用 肉眼 不 易 辨 别 。 图 10.63 和 图 10.64 
显示 了 分 别 令 a1=6 和 a,=4 计 算式 (10.6-8) 和 式 (10.6-9) 时 得 到 的 结果 。 根据 图 10.63 F u =3 处 的 波峰 ， 
由 式 (10.6-10) 得 到 V,=0.5. EPE, 根据 图 10.64 中 w=4 处 的 波峰 ， 式 (10.6-11) 得 到 V= 1.0。 











图 10.61 LANDSAT 的 图 像 帧 ( 原 图 像 由 图 10.62 图 10.61 中 图 像 的 灰 度 图 ， 目 标 已 用 圆圈 标 
Cowart, Snyder 和 Ruedger 提供 ) 出 ( 原 图 像 由 Rajala, Riddle 和 Snyder 提供 ) 
640 一 
560 4 
480 
400 100 一 
S 320 4 80 
x 
a 2404 T 60 
= x 
160 4 — 40 
过 
80 = 20- 
0 0 
0 4 8 12 16 20 24 28 32 36 40 0 4 8 12 16 20 24 28 32 36 40 
频率 频率 


图 10.63 IR (10.6-8) 的 谱 , 在 w=3 处 显示 了 一 个 波 ”图 10.64 式 (10.6-9) 的 谱 ， 在 w=4 处 显示 了 一 个 波 
峰 ( 原 图 像 由 Rajala, Riddle 和 Snyder 提供 ) 峰 ( 原 图 像 由 Rajala, Riddle 和 Snyder 提供 ) 
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借助 于 图 10.63 和 图 10,64, 我 们 可 以 解释 选择 al 和 a 的 原则 。 例如 , 假设 我 们 用 a,= 15 取代 a,=4。 
在 这 种 情况 下 , 图 10.64 中 的 波峰 将 位 于 w=15 和 17 处, 因为 乃 =1.0, 这 将 是 一 种 严重 的 混淆 结果 。 
如 2.5.4 节 讨 论 的 那样 , 混淆 是 由 欠 采 样 造成 的 ( 当 的 范围 由 决定 时 , 当前 讨论 中 , 图 像 帧 数 太 少 ) 。 
因为 u = aV， 故 一 种 可 能 是 将 a 选择 为 最 接近 a = Umax! Vma 的 整数 ， 其 中 uma 是 由 建立 的 混淆 频率 
限制 ， 而 Vina 是 期 望 的 物体 的 最 大 速度 。 


小 结 


在 大 多 数 自动 图 像 模式 识别 和 场景 分 析 应 用 中 ， 图 像 分 割 是 一 种 基本 的 预 处理 步 又 。 如 前 面 各 节 
中 各 个 例子 说 明 的 那样 ， 选 择 何 种 分 割 技术 主要 取决 于 所 考虑 问题 的 特殊 性 。 本 章 中 讨论 的 各 种 方法 
尽管 并 不 十 分 详尽 ， 但 却 是 在 实际 应 用 中 普遍 使 用 的 代表 性 技术 。 下 面 的 参考 文献 可 作为 读者 进一步 
研究 该 主题 的 基础 。 


参考 文献 


由 于 分 割 在 自动 图 像 处 理 领域 中 所 起 的 核心 作用 ， 大 多 数 关 于 图 像 处 理 、 图 像 分 析 和 计算 机 视觉 的 著述 中 
都 涵盖 了 这 一 主题 -以 下 图 书 为 这 一 主题 提供 了 补充 和 /或 辅助 阅读 材料 : Umbaugh[2005] , Davies[2005] . Gonzalez, 
Woods and Eddins[2004] Shapiro and Stockman[2001], Sonka et al.[1999], Petrou and Bosdogianni[1999]。 

使 用 模板 检测 灰 度 的 不 连续 性 ( 见 10.2 节 ) 已 有 较 长 的 历史 。 这 些 年 来 ， 人们 提出 了 无 数 模板 
Roberts[1965]、Prewitt[1970] 、Kirsh[1971] 、Robinson[1976] Frei and Chen[1977] 和 Canny[1986]。Fram and 
Deutsch[1975] 中 包含 了 大 量 的 模板 及 这 些 模板 的 性 能 评价 。 模 板 性 能 存在 的 问题 ， 特 别 是 对 边缘 检测 来 说 ， 
仍 是 相当 重要 的 研究 领域 ， 详 见 Qian and Huang[1996]、Wang et al.[1996], Heath et al:[1997，1998] 和 
Ando[2000]。 彩 色 图 像 边缘 检测 在 许多 感知 的 应 用 中 正 逐 渐 普 及 , FEJL Salians, Abidi and Gonzalez[1996]、 
Zugaj and Lattuati[1998]、Mirmehdi and Petrou[2000] 和 Plataniotis and Venetsanopoulos[2000]。 图 像 特征 和 
模板 性 能 之 间 的 相互 影响 也 是 当前 人 们 感 兴趣 的 主题 , 见 Ziou[2001]。 书 中 关于 拉 普 拉 斯 算 子 的 零 交叉 性 
质 的 介绍 , 源 于 Marr and Hildredth[1980] 和 Marr[1982]， 也 可 参见 Clark[1989] 关 于 使 用 零 交 叉 算 法 进行 边 
缘 鉴别 的 论文 (Piech[1990] 对 Clark 的 论文 给 出 了 部 分 修正 )。 如 10.2 节 中 提 到 的 那样 , 通过 高 斯 拉 普 拉 斯 
的 零 交叉 方法 是 一 种 重要 的 方法 ,其 相对 性 能 仍 是 一 个 活跃 的 研究 主题 (Gunn[1998, 1999]) 。 如 其 名 称 暗 
示 的 那样 ， 在 10.2.6. 节 讨论 的 坎 尼 检测 器 基于 坎 尼 的 论文 [1986]。 这 一 主题 20 年 后 的 例子 见 Zhang and 
Rockett[2006]。 

霍 夫 变换 (Hough[1962]) 是 进行 全 局 像素 连接 和 曲线 检测 的 一 种 实用 方法 。 本 章 讨 论 的 这 种 基本 变换 的 
大 量 推广 已 提出 多 年 。 例 如 ，Lo and Tsai[1995] 讨 论 了 检测 细 线 的 一 种 方法 ，Guilet al.[1995, 1997] 解 决 了 霍 
夫 变换 的 快速 实现 和 简单 曲线 的 检测 问题 ，Daul et al[1998] 将 霍 夫 变换 进一步 推广 到 了 检测 椭圆 形 弧 线 ， 
Shapiro[1996] 则 解决 了 对 灰 度 图 像 实现 霍 夫 变换 的 问题 

如 10.3 节 开 始 时 提 到 的 那样 ， 阔 值 处 理 技术 享有 重要 的 普及 地 位 ， 因 为 这 种 技术 实现 简单 。 关 于 这 一 

主题 ， 许 多 文献 中 报告 了 大 量 的 研究 成 果 。 在 Sahoo et al[1988] 和 Lee et al[1990] 的 综述 性 文章 中 ， 可 以 看 
到 对 这 类 文献 的 较 好 评价 。 除 了 本 章 中 讨论 的 技术 外 , 处 理光 照 和 反射 影响 (10.3.1 FF) 所 使 用 的 其 他 方法 ， 
见 Perez and Gonzalez[1987]、 Parker[1991]、 Murase and Nayar[1994], Bischsel[1998], Drew et alL[1999] 和 
Toro and Funt[2007]。 关 于 10.3.2 节 中 的 其 他 读物 ， 见 Jain et al.[1995]. 

最 优 全 局 净值 处 理 (10.3.3 节 ) 的 早期 工作 已 在 Chow and Kaneko[1972] 中 举例 说 明 (我 们 将 在 12.2.2 节 讨 
论 这 种 方法 ) 。 虽 然 理 论 上 它 是 最 佳 的 ,但 这 种 方法 在 灰 度 阀 值 处 理 中 的 应 用 却 受到 了 限制 ， 因 为 需要 估计 
概率 密度 函数 。10.3.3 节 中 源 自 Otsu[1979] 的 最 佳 方法 得 到 了 人 们 的 广泛 接受 ， 因 为 它 使 优秀 的 性 能 和 实现 
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简单 结合 起 来 , 且 仅 要 求 估计 图 像 的 直方 图 。 使 用 预 处 理 (10.3.4 节 和 10.3.5 节 ) 的 基本 概念 可 回溯 至 White 
and Rohrer[1983] 的 早期 论文 ， 该 论文 在 解决 困难 的 分 割 问题 中 ， 综 合 使 用 了 阔 值 处 理 、 梯 度 和 拉 普 拉 斯 
算 子 。 前 面 三 篇 文章 中 讨论 的 方法 , 与 Cheriet et al.[1998]、 Sauvola and Pietikainen[2000]、 Liang et al.[2000] 
和 Chan et al.[2000] 在 立 值 处 理 方面 所 做 的 工作 几乎 相差 了 近 20 年 , 因此 在 图 像 分 割 能 力 方面 比较 这 些 方 
法 的 基本 相似 性 是 很 有 趣 的 。 关 于 多 阔 值 处 理 ( 见 10.3.6 节 ) 的 其 他 读物 ， 见 Yin and Chen[1997]、Liao et 
al.[2001] 和 Zahara et al.[2005]。 关 于 可 变 立 值 处 理 ( 见 10.3.7 W) 的 其 他 读物 ， 见 Parker[1997] 和 Delon et 
al.[2007]。 

面向 区 域 分 割 这 一 主题 的 早期 著述 见 Fu and Mui[1981]。 为 分 割 目的 而 综合 区 域 和 边界 信息 的 早期 
研究 见 Haddon and Boyce[1990] 和 Pavlids and Liow[1990]。Hojjatoleslami and Kittler[1998] 提 出 的 一 种 较 
新 区 域 生 长 方法 也 很 重要 。 近 期 基本 涵盖 面向 区 域 分 割 概念 的 文献 ， 见 Shapiro and Stockman[2001] 和 
Sonka et al.[1999]. 

10.5 节 所 示 的 分 水 岭 分 割 是 一 个 强大 的 概念 。 涉 及 分 水 岭 分 割 的 早期 文献 见 Serra[ 1988], Beucher{ 1990] 
和 Beucher and Meyer[1992]。Baccar et al[1996] 讨 论 了 基于 数据 融合 和 形态 学 分 水 岭 的 分 割 方法 。 完 全 致力 
于 分 水 岭 分 割 的 专刊 Pattern Recognition[2000] 表 明 ，10 年 来 该 领域 的 研究 进展 相当 明显 。 如 我 们 在 10.5 节 
中 讨论 的 那样 ， 使 用 分 水 岭 方法 的 关键 问题 之 一 是 过 度 分 割 问题 。Najmanand and Schmitt[1996]、Haris et 
al.[1998] 和 Bleau and Leon[2000] 是 处 理 这 种 问题 的 例证 。 Bieniek and Moga[2000] 讨 论 了 一 种 基于 连通 分 量 的 
分 水 岭 分 割 算 法 。 

10.6.1 节 中 的 内 容 来 自 Jain, R.[1981], 也 可 参阅 Jain, Kasturi and Schunck[1995]。10.6.2 节 中 的 内 容 来 自 
Rajala, Riddle and Snyder[1983]， 也 可 参阅 Shariat and Price[1990] 和 Cumani et al.[1991]。 关 于 运动 估计 的 其 他 
读物 ， 见 Sonka et al.[1999], Shapiro and Stockman[2001]、Snyder and Qi[2004] 和 Davies [2005]， 也 可 参阅 
Alexiadis and Sergiadis[2007]。 


习题 


六 10.1 证 明 式 (10.2-2) 的 正确 性 。( 提 示 : 用 泰勒 级 数 展开 ， 并 仅 保留 线性 项 。) 
*10.2 设 有 一 幅 包 含有 水 平 直 线 、 垂 直 直 线 、45° 方 向 直线 和 一 45 方向 直线 的 二 值 图 像 。 给 出 一 组 大 小 
为 5x5 的 模板 ， 要求 这 些 模板 可 用 于 检测 这 些 直 线 中 的 1 像素 间断 。 假 设 直线 和 背景 的 灰 度 分 别 
是 1 和 0。 
10.3 ”提出 一 种 检测 二 值 图 像 的 线段 中 长 度 从 1 到 天 个 像素 的 裂 颖 的 技术 。 假 设 线 宽 为 1 像素 。 你 的 技 
术 要 以 8 邻 域 连通 性 分 析 为 基础 ， 而 不 能 试图 构造 检测 裂 颖 的 模板 。 
10.4 ”参考 图 10.7， 回 答 下 列 问题 。 
K (a) 图 10.7(e) 中 某 些 连接 焊 点 和 中 心 元 素 的 线 是 单线 ， 而 其 他 线 是 双 线 。 解 释 一 下 为 什么 。 
(b) 提出 一 种 消除 图 10.7 (À 中 那些 - 45" 方 向 线 的 部 分 分 量 的 方法 。 
10.5 参考 图 10.8 中 的 边缘 模型 。 
* (a) 假设 我 们 使 用 图 10.14 中 的 Prewitt 算 子 来 计算 每 个 模型 的 梯度 幅度 。 请 画 出 通过 梯度 图 像 中 心 
的 水 平 剖 面 线 。 
(b) 画 出 每 个 对 应 角度 图 像 的 水 平 剖 面 。 
(注意 : 在 回答 该 问题 时 不 要 生成 梯度 图 像 和 角度 图 像 。 简 单 地 提供 剖面 线 的 图 形 ， 显 示 像 你 预期 
的 幅度 和 角度 的 剖面 线 即 可 。) 
10.6 ”考虑 穿 过 一 幅 二 值 图 像 中 部 的 一 条 水 平 灰 度 前 面 线 ， 二 值 图 像 中 包含 一 个 垂直 通过 图 像 中 心 的 台 
阶 边缘 。 画 出 已 被 一 个 大 小 为 nxn 且 系 数 等 于 n ) 的 平均 模板 模糊 后 的 图 像 的 剖面 线 。 为 简单 
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起 见 ， 假 设 图 像 已 被 标定 ， 即 其 灰 度 级 在 边缘 的 左 侧 为 0， 在 右 侧 为 1。 此 外 ， 假 设 模 板 的 尺寸 远 
小 于 图 像 的 尺寸 ， 以 便 在 靠近 水 平 灰 度 剖面 的 中 心 处 不 必 关注 图 像 的 边界 效应 。 
x10.7 ”假设 我 们 已 使 用 示 于 右 图 中 的 边缘 模型 代 奉 了 图 10.10 中 的 斜坡 模型 。 请 写 出 每 个 剖面 的 梯度 和 拉 
普 拉 斯 算 子 。 
10.8 ”参照 图 10.14， 回 答 下 列 问题 。 
(a) 假设 使 用 Sobel 模板 得 到 了 g, 和 gy 证 明 在 这 种 情 
况 下 ,使 用 式 (10.2-10) 和 式 (10.2-20) 计算 得 到 的 | 
梯度 幅度 可 得 出 相同 的 结果 。 a 
(b) 证 明 对 于 Prewitt 模板 也 是 正确 的 。 = i 


| | 
*10.9 证 明 图 10.14 和 图 10.15 中 的 Sobel 模板 和 Prewitt 模板 | 
仅 对 水 平 边缘 、 垂 直 边 缘 和 土 45* 方 向 边缘 给 出 各 向 同 ee 人 
10.10 某 些 使 用 二 维 模板 处 理 图 像 一 遍 得 到 的 结果 ， 也 可 使 用 一 维 模板 处 理 图 像 两 遍 来 得 到 。 例 如 ， 使 
用 系数 为 19、 大 小 3x3 的 平滑 模板 得 到 的 结果 , 可 通过 对 图 像 使 用 一 次 模板 [1, 1, 1], 然后 对 结果 


应 用 模板 





| | 


se 





l 
1 
1 


最 终结 果 再 乘 以 1/9 得 到 。 证 明 Prewitt 模板 ( 见 图 10.14) 的 响应 可 通过 使 用 一 次 形 如 [-1, 0, 1] 的 
差分 模板 (或 其 对 应 的 正 交 阵 ) ， 然 后 使 用 一 次 形 如 [1, 2, 1] 的 平滑 处 理 模板 (或 其 对 应 的 正 交 阵 ) 
得 到 。 
10.11 3x3 罗盘 梯度 算 子 设计 用 来 度量 8 个 方向 上 的 梯度 : E, NE, N, NW, W, SW, S 和 SE。 
x (a) 使 用 系数 值 0, 1,- 1, 一 2 或 2， 给 出 这 8 个 算 子 的 形式 。 
(b) 指定 每 个 模板 的 梯度 向 量 方向 ， 记 住 梯度 方向 与 边缘 方向 是 正 交 的 。 
10.12” 右 图 所 示 二 值 图 像 中 ， 和 矩形 的 大 小 为 mxn 像素 。 
(a) 以 式 (10.2-20) 给 出 的 近似 为 基础 ,这 幅 图 像 的 梯度 幅度 像 什么 ? 假 
设 g. 和 gg, 是 使 用 Prewitt 算 子 得 到 的 。 说 明 梯 度 图 像 中 所 有 相应 的 








不 同 像素 值 。 

(b) 画 出 用 式 (10.2-11) 计算 得 到 的 边缘 方向 的 直方 图 。 精 确 标 出 直方 
图 中 每 个 分 量 的 高 度 。 

(c) 根据 式 (10.2-7) 给 出 的 近似 ， 该 图 像 的 拉 普 拉 斯 图 像 是 什么 ? 说 明 拉 普 拉 斯 图 像 中 所 有 相应 的 
不 同 像素 值 。 


10.13 ”假设 图 像 f(x,y) 与 大 小 为 nxn 的 模板 (系数 为 1/n? ) 卷 积 后 ， 产 生 了 一 幅 平滑 后 的 图 像 f(x,y) 。 
x (a) 以 模板 尺寸 的 函数 的 形式 , 推导 平滑 后 图 像 的 边缘 强度 (边缘 幅度 ) 的 表达 式 。 为 简单 起 见 , 假 
设 n 是 奇数 ， 且 边缘 是 使 用 如 下 偏 导 数 得 到 的 : 
Ff lox=f(x+ly)-f(x,y) 和 /=f(x, y+- fa, y) 
(b) 证 明 平滑 后 的 图 像 的 最 大 边缘 强度 与 原 图 像 的 最 大 边缘 强度 之 比 为 11n。 换 名 话说， 边缘 强度 
与 平滑 模板 的 尺寸 成 反比 。 
10.14 ”参考 式 (10.2-23) : 
* (a) 证 明 一 个 高 斯 算 子 的 拉 普 拉 斯 V” G(x, y) 为 零 。 
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(b) 证 明 用 这 个 算 子 卷 积 的 任何 图 像 的 平均 值 也 为 零 。 (提示 : 考虑 在 频率 域 中 解决 该 问题 ， 使 用 
卷 积 定理 ， 以 及 一 个 函数 的 平均 值 与 其 在 原点 处 计算 的 傅 里 叶 变 换 成 正比 这 一 事实 。) 
(c) 一 般 情 况 下 , 如 果 我 们 (1) 使 用 图 10.4 (a) 中 的 模板 来 计算 使 用 大 小 为 3x3 的 拉 普 拉 斯 模板 的 高 
斯 低 通 滤波 器 的 拉 普 拉 斯 , 并 (2) 将 得 到 的 结果 与 任何 图 像 卷 积 , 那么 请 问 (b) 还 正确 吗 ? 请 解 
释 。( 提 示 : 参见 习题 3.16。) 
10.15 参考 图 10.22 (c) 。 
(a) 解释 为 什么 边缘 构成 闭合 的 轮廓 线 。 
k (b) 寻找 边缘 位 置 的 零 交 叉 方 法 总 会 导致 团 合 轮廓 吗 ? 请 解释 。 
10.16 ”我 们 时 常 发 现 文献 中 推导 高 斯 拉 普 拉 斯 (LoG) 时 ， 都 用 如 下 表达 式 开 始 : 


G(r)= ei [20° 


Rr =x y o Wa, 用 二 阶 偏 导数 得 到 LoG: V*G(r)=0'G/dr? 。 最 后 , 使 用 x? + y? BHR? 
得 到 了 (不 正确 的 ) 结 果 : 
V’G(x, y)=[(x +y =0)/oJexp[t-(x* + y”)/207] 
请 推导 该 结果 并 解释 该 表达 式 与 式 (10.2-23) 不 同 的 原因 。 
10.17 (a) 推导 式 (10.2-27) o 
(b) $k =0,/0, 表示 DoG 函数 的 标准 差 比率 。 请 使 用 上 和 o, 来 表示 式 (10.2-27) 。 
10.18 在 下 文中 ,假设 G 和 ,分别 是 大 小 为 wx 和 MXN 的 离散 阵列 。 
友 (a) 证 明 式 (10.2-21) 中 的 高 斯 函数 与 图 像 f(x, 7 的 二 维 卷 积 ， 可 以 表示 为 先 沿 f(x， «itt ill) PEAT 
一 维 卷 积 ， 然 后 沿 所 得 结果 的 列 ( 行 ) 进行 一 维 卷 积 (关于 离散 卷 积 的 讨论 ， 见 3.4.2 节 ) 。 
(b) 推导 出 使 用 (a) 中 的 一 维 卷 积 方法 相对 于 直接 执行 二 维 卷 积 的 优势 的 表达 式 。 假 设 G(x, y) 被 取 
样 为 一 个 大 小 为 nxn 的 阵列 ， 而 f(x, yp) 是 一 个 大 小 为 MxN 的 阵列 。 计 算 优势 是 二 维 卷 积 要求 
的 乘法 次 数 与 一 维 卷 积 要 求 的 乘法 次 数 之 比 。 
10.19 (a) 证 明 Marr-Hildreth 算法 的 步骤 1 和 步 又 2 可 以 通过 使 用 4 次 一 维 卷 积 来 实现 。 (提示 : 参考 习 
题 10.18(a) , 将 拉 普 拉 斯 算 子 表示 为 由 式 (10.2-5) 和 式 (10.2-6) 给 出 的 两 个 偏 导数 之 和 , 如 习题 
10.10 那 样 ， 并 使 用 一 个 一 维 模板 实现 每 个 导数 。) 
(b) 推导 出 使 用 (a) 中 的 一 维 卷 积 方法 相对 于 直接 执行 二 维 卷 积 的 优势 的 表达 式 。 假 设 G(x, y) 
样 为 一 个 大 小 为 nxn 的 阵列 ， 而 了 f(x,y») 是 一 个 大 小 为 MxN 的 阵列 。 计 算 优势 是 二 维 卷 积 要 求 
的 乘法 次 数 与 一 维 卷 积 要 求 的 乘法 次 数 之 比 ( 见 习题 10.18) 。 
10.20 (a) 用 一 维 卷 积 代替 二 维 卷 积 ， 用 公式 表示 坎 尼 算法 的 步骤 1 和 步骤 2 中 梯度 幅度 图 像 的 计算 。 
(b) 相对 于 使 用 二 维 卷 积 实现 ,使 用 一 维 卷 积 方法 的 计算 优势 是 什么 ? (BERR 1 中 的 二 维 高 斯 滤 
波 需 被 取样 为 一 个 大 小 为 nxn 的 阵列 ， 且 输入 图 像 的 大 小 为 MxN。 将 计算 优势 表 示 为 每 种 方 
法 所 要 求 的 乘法 次 数 之 比 。 
10.21 参考 图 10.8 中 的 三 个 垂直 边缘 模型 和 对 应 的 剖面 。 
太 (a) 假设 我 们 使 用 Sobel 模板 来 计算 三 个 边缘 模型 的 梯度 幅度 。 画 出 三 幅 梯度 图 像 的 水 平 灰 度 剖 


面 线 。 
太 (b) 画 出 三 幅 拉 普 拉 斯 图 像 的 水 平 灰 度 剖 面 线 ， 假 设 拉 普 拉 斯 是 使 用 图 10.4 (a) 中 的 3x3 模板 计 
算 的 。 


* (c) 仅 使 用 Marr-Hildreth 边缘 检测 器 的 前 两 步 产 生 的 图 像 ， 重 复 上 一 问题 。 
(d) 对 于 坎 尼 边 缘 检 测 器 的 前 两 步 重复 上 述 问题 。 你 可 以 忽略 角度 图 像 。 


10.22 
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(e) 针对 坎 尼 边缘 检测 器 ， 画 出 角度 图 像 的 水 平 剖 面 线 。 (ERE: 回答 这 一 问题 时 不 必 生 成 图 像 ， 
只 须 简 单 地 画 出 剖面 线 ， 并 说 明 你 所 期 望 的 图 像 剖面 线 像 什么 。) 

参考 10.2.7 节 中 讨论 的 霍 夫 变换 。 

(a) My=ar+b 的 斜 截 式 形式 ， 导 出 一 条 线 的 法 线 表 示 的 一 般 过 程 。 


x (b) RAB y= 一 3x+2 的 法 线 表示 。 


* 10.23 


10.24 


10.25 


* 10.26 
* 10.27 


10.28 


* 10.29 


10.30 


参考 10.2.7 节 中 讨论 的 霍 夫 变换 。 

(a) 解释 为 什么 图 10.33 (a) 中 的 点 1 的 霍 夫 映射 在 图 10.33 (b) 中 为 一 条 直线 。 

(b) 这 是 仅 能 产生 这 样 结果 的 点 吗 ? 请 解释 。 

(c) 以 图 10.33 (b) 中 标 为 O 的 曲线 为 例 ， 解 释 反 射 的 邻接 关系 。 

证 明 实 现 10.2.7 节 所 述 累加 单元 方法 所 需 的 操作 次 数 与 图 像 平面 ( 即 j 平 面 ) 中 的 背景 点 数量 n 呈 
线性 关系 。 

图 像 分 割 技术 的 重要 应 用 领域 是 处 理由 所 谓 的 泡沫 室 活动 导致 的 图 像 。 这 些 图 像 是 在 高 能 物理 实 
验 中 得 到 的 ,在 这 种 实验 中 ,一 束 已 知 粒子 直接 打 到 一 个 已 知 核子 上 。 一 次 典型 的 活动 由 任何 一 
次 碰撞 活动 中 的 输入 轨迹 以 及 粒子 由 撞击 点 分 散发 出 的 二 次 轨迹 组 成 。 请 提出 一 种 分 割 方法 来 检 
测 所 有 的 轨迹 ,这些 轨迹 至 少 包含 100 个 像素 并 与 水 平方 向 有 如 下 6 个 方向 的 夹 角 : +20°, +40° 
和 土 60>。 在 这 6 个 方向 上 ， 人 允许 的 估计 误差 为 +5°。 一 条 有 效 的 轨迹 必须 至 少 要 有 100 个 像素 长 ， 
间隙 不 多 于 3 个 , 并且 每 个 间隙 不 超过 10 个 像素 的 长 度 。 你 可 以 假设 图 像 已 进行 了 预 处 理 , 形成 了 
二 值 图 像 ， 并 且 除 了 发 出 轨迹 的 撞击 点 以 外 ， 所 有 轨迹 均 为 1 像素 宽 。 你 的 过 程 应 能 分 辨 原点 不 同 
但 方向 相同 的 轨迹 。 (提示 : 以 霍 夫 变 换 作为 你 的 解决 方案 的 基础 。) 

重新 说 明 10.3.2 节 中 的 全 局 阔 值 处 理 算法 ， 以 便 它 使 用 一 幅 图 像 的 直方 图 来 代替 该 图 像 本 身 。 
证 明 10.3.2 节 中 的 基本 全 局 阔 值 处 理 算法 在 有 限 几 步 内 收 么 。 (提示 : 使 用 来 自习 题 10.26 的 直方 
图 表达 式 。) 

给 出 一 种 解释 ， 为 什么 10.3.2 节 的 基本 全 局 阔 值 处 理 算法 的 初始 阔 值 必须 在 图 像 的 最 小 值 和 最 大 
值 之 间 。 (提示 : 构建 一 个 例子 来 说 明 闵 值 选 在 该 范围 之 外 算法 会 失败 。) 

使 用 10.3.2 节 的 基本 全 局 冰 值 处 理 算法 得 到 的 闽 值 与 起 始点 无 关 吗 ? 如 果 你 的 回答 是 “是 ”, 证 
明 它 ， 如 果 回 答 是 “不 ”， 给 出 一 个 例子 。 

你 可 以 假设 下 列 两 种 情况 ， 在 迭代 中 国 值 限制 在 开 区 间 (0, 工 -1) 内 。. 


x (a) 如 果 图 像 的 直方 图 在 所 有 可 能 的 灰 度 级 上 都 是 均匀 的 , 请 证 明 10.3.2 节 的 基本 全 局 阔 值 处 理 算 


10.31 


* 10.32 


PORES RAPP IRIEL — 1)/2 处 。 
(b) 如 果 一 幅 图 像 的 直方 图 是 双 模 式 的 , FLA eT SE A, TEBE SEAS > Jey EL 
处 理 算法 将 收敛 到 这 两 个 模式 的 均值 之 间 的 中 点 。 i 
参考 10.3.2 PAPE. BEEP, BOTA, BAMAR 
AN A exp[-(z - m) /20?] FI A, exp[-(z - m) /203] 的 高 斯 曲线 。 假 设 mi>m;， 且 初始 的 工 在 图 
像 的 最 大 灰 度 值 和 最 小 灰 度 值 之 间 。 当 算法 收敛 时 ,给 出 以 下 陈述 为 真 的 条 件 ( 用 这 些 曲线 的 参 
数 表示 ) : 
(a) BESEF (m + m2)/2。 
(b) PETE m 的 左边 。 
(c) 阅 值 位 于 区 间 (mi + m2) /2< T<m, 内。 
如 果 这 些 条 件 的 任意 一 条 不 存在 ， 请 说 明 原 因 。 
(a) 证 明 式 (10.3-15) 的 第 一 行 来 自 式 (10.3-14) 、 式 (10.3-10) 和 式 (10.3-11) 。 
(b) 证 明 式 (10.3-15) 的 第 二 行 来 自 第 一 行 。 
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10.33 证 明 对 于 区 间 0 科 上 科 工 -1 内 的 大 值 ， 式 (10.3-18) 总 存在 一 个 最 大 值 。 
10.34 ”参考 式 (10.3-20) ， 预 设 一 个 参量 ， 可 确定 0<w(k) <l, k 在 0<k<L-1 范 围 内 , ERRERA 
恒定 灰 度 时 可 达到 最 小 值 ， 并 且 仅 在 图 像 有 两 个 值 0 和 工 -1 时 最 大 值 才 发 生 。 
%10.35 (a) 假设 一 幅 图 像 f(x,y) 的 灰 度 在 区 间 [0, 了 内 , 并 且 阅 值 了 成 功 地 将 该 图 像 分 割 为 物体 和 背景 ; 证 
明 效 值 交 =1- 了 将 成 功 地 把 fx, 习 的 负 图 像 分 割 为 相同 的 区 域 。 这 里 ，“ 负 ”这 一 术语 被 用 于 
3.2.1 节 定 义 的 场景 。 
(b) Æa) 中 , 把 一 幅 图 像 映射 为 其 负 图 像 的 灰 度 变换 函数 ,是 一 个 负 斜 向 的 线性 函数 。 说明 一 个 
任意 的 灰 度 变换 函数 必须 满足 关于 将 被 保留 的 国 值 T 对 原始 图 像 可 分 割 性 的 条 件 。 灰 度 变 换 
后 的 赣 值 将 是 什么 值 ? 
10.36 “ 右 图 所 示 图 像 中 的 物体 和 背景 , 在 标 度 范围 [0, 255] 内 具有 的 平均 
灰 度 分 别 为 180 和 70。 该 图 像 被 均值 为 0、 标准 差 为 10 个 灰 
度 级 的 高 斯 噪声 污染 ,请 提出 一 种 正确 分 割 率 为 90% 或 更 高 百 
分 比 的 阔 值 处 理 方法 。 (回忆 一 下 ， 高 斯 曲线 下 99.7% 的 面积 
位 于 均值 的 +3o KIA, HEF o 是 标准 差 。) 
10.37 参考 图 10.37(b) 中 的 灰 度 斜坡 图 像 和 10.3.7 节 中 讨论 的 移动 平均 
算法 。 假 设 图 像 的 尺寸 为 400x700 像素 ， 其 最 小 值 和 最 大 值 分 
别 为 0 和 1， 这 里 的 0 项 仅 包含 在 第 一 列 中 。 
友 (a) 车 b=0 而 为 任意 值 , 那么 使 用 移动 平均 算法 分 割 该 图 像 后 的 结果 是 什么 ? 解释 该 图 像 像 什么 。 
(b) 现在 ,斜坡 的 方向 反 转 ， 因 此 ， 最 左 侧 的 值 为 1 而 最 右 侧 的 值 为 0。 重复 问题 (a) 。 
(c) 重复 问题 (a) , 但 n=4,b=1。 
(d) 重复 问题 (a) , 但 x=100, b=1。 
10.38 ”提出 一 个 区 域 生长 算法 来 分 割 习 题 10.36 中 的 图 像 。 
太 10.39 使 用 10.4.2 节 中 讨论 过 的 分 裂 和 聚合 过 程 来 分 割 右 图 所 示 的 图 像 。 让 
如 果 R 中 的 所 有 像素 都 有 相同 的 灰 度 ， 则 令 O(R,)=TRUE 。 给 出 LJ L 

















对 应 于 你 的 分 割 的 四 又 树 。 

10.40 ZIEH 10.24 中 对 天 鹅 星座 环 图 像 的 稀疏 区 域 进 行 分 割 得 到 的 由 1 十 
构成 的 区 域 .提出 一 种 将 该 区 域 作为 模板 来 隔离 图 像 中 的 三 个 主要 i | 
成 分 的 技术 : (1) 背景 ，(2) BORA, (3) RAR. a as a 

10.41 参考 10.5.3 节 中 的 讨论 。 

x (a) 说 明 在 分 水 岭 算 法 执行 的 过 程 中 ，C,CM,) AT [n] 的 元 素 从 不 被 替换 。 
(b) 说 明 当 nn 增加 时 ,集合 C,(M,) 和 集合 7T[n] 中 的 元 素数 量 随 着 的 增加 ， 不 是 增加 ， 就 是 保持 
不 变 。 

10.42 ”在 10.5 节 中 , 使 用 分 水 岭 分 割 算 法 得 到 的 边界 形成 了 一 个 闭环 (例如 , 见 图 10.56 和 图 10.58) 。 请 预 设 
一 个 参量 ， 使 得 应 用 这 个 算法 无 论 如 何 总 能 得 到 闭合 形式 的 边界 。 

*10.43 ”对 于 下 图 所 示 的 一 维 灰 度 横 截面 ， 给 出 逐步 构建 水 坝 的 实现 过 程 。 在 每 一 步 又 画 出 显示 水 位 和 已 
构建 大 坝 的 横 截 面 。 
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10.44 ”如 果 我 们 在 式 (10.6-4) 中 和 针对 7T( 而 非 针 对 -人 进行 测试 ， 那 么 图 10.59 (c) 中 的 负 ADI 图 像 会 是 什 
么 样子 ? 

10.45 判断 下 列 说 法 是 否 正确 。 对 你 的 答案 进行 解释 。 

* (a) 只 要 物体 正在 运动 ,那么 绝对 ADI 中 的 非 零 项 的 维 数 就 会 持续 增加 。 

(b) 不 管 物体 是 否 运 动 ， 正 ADI 中 的 非 零 项 总 是 占据 相同 的 面积 。 
(c) 只 要 物体 正在 运动 ， 负 ADI 的 非 零 项 的 维 数 就 会 持续 增加 。 

10.46 ”假设 在 例 10.28 中 将 x 轴 方 向 的 运动 设 为 零 。 现 在 物体 仅 沿 > 轴 以 每 帧 1 像素 的 速度 运动 28 Wi, 
然后 瞬间 转向 ， 向 相反 方向 运动 28 帧 。 在 这 些 条 件 下 ， 图 10.63 和 图 10.64 会 是 什么 样子 ? 

* 10.47 ” 预 置 一 个 参量 ,证明 当 式 (10.6-12) 和 式 (10.6-13) 中 的 S, AS, 的 符号 相同 时 ， 速 度 分 量 K 为 正 。 

10.48 一 家 自动 制药 厂 为 质量 控制 目的 ， 采用 图 像 处 理 方 法 来 测量 药片 的 形状 。 该 系统 的 分 割 步 又 是 以 
Otsu 方法 为 基础 的 。 由 于 检测 线 的 速度 很 高 ， 因 此 需要 速率 非常 高 的 闪光 来 “停止 ”运动 。 照 明 
灯 较 新 时 ， 照 明灯 投影 均匀 的 光线 。 灯 泡 老 化 时 ， 照 明 模 式 的 退化 根据 下 面 的 公式 是 时 间 和 空间 
坐标 的 函数 : 

i Wa 

P, (M, M) 是 观察 区 域 的 中 心 ， :是 以 月 为 单位 增加 的 测试 时 间 。 灯 泡 是 试验 性 的 ， 且 制造 商 并 
不 了 解 灯光 的 4(0 特 隆 。 所 知道 的 全 部 是 在 灯泡 的 寿命 期 ，4(b 总 是 大 于 上 式 中 的 负 值 ， 因 为 光照 
不 能 为 负 。 观 察 表明 ， 当 灯泡 较 新 时 ，Otsu 算法 工作 得 很 好 ， 其 光照 模式 在 整个 图 像 上 近似 于 常 
数 。 然 而 ， 分 割 性 能 却 随时 间 恶 化 。 由 于 试验 性 灯泡 格外 昂贵 ， 因 此 请 你 作为 顾问 在 计算 上 帮助 
解决 该 问题 ， 从 而 延长 灯泡 的 寿命 。 给 你 很 大 的 灵活 性 ， 可 以 在 成 像 摄 像 机 取景 区 域 的 边缘 附近 
安装 任何 特殊 标记 或 其 他 可 视 提 示 。 请 提出 一 个 能 让 工程 计划 经 理 理解 的 详细 解决 方案 。 (提示 : 
回顾 2.3.4 节 中 讨论 的 图 像 模 型 ， 并 考虑 使 用 一 个 其 反射 率 已 知 的 小 目标 。) 

10.49 飞行 中 的 子弹 的 速度 可 以 用 成 像 技术 来 估计 。 选 择 一 种 包括 使 用 一 台 TV 摄像 机 和 可 以 曝光 场景 
秒 的 闪光 灯 的 方法 。 子 弹 长 2.5 cm， 宽 Lcm， 速 度 范 围 为 700 土 200 m/s。 光 学 摄像 机 拍摄 了 一 幅 
水 平分 辨 率 为 256x256 的 数字 图 像 ， 其 中 子弹 占据 了 10%. 

* (a) 为 保证 运动 对 图 像 造 成 的 模糊 不 超过 1 像素 ， 确 定 最 大 的 天 值 。 
(b) 确定 每 秒 必须 得 到 的 帧 数 的 最 小 值 , 以 便 保证 在 子弹 穿 过 摄像 机 的 视 场 时 , 至 少 得 到 两 幅 子弹 
的 完整 图 像 。 

(c) 提出 一 种 能 自动 地 从 帧 序列 中 提取 子弹 的 分 割 过 程 。 
(d) 提出 一 种 能 自动 地 确定 子弹 速度 的 方法 。 








Socrates 





使 用 第 10 章 中 讨论 的 那些 方法 将 一 幅 图 像 分 割 成 多 个 区 域 后 ， 分 割 后 的 像素 集 经 常 以 一 种 适合 
于 计算 机 进一步 处 理 的 形式 来 表示 和 描述 。 基 本 上 , 表示 一 个 区 域 涉及 两 种 选择 : (1) 我 们 可 以 根据 其 
外 部 特征 (其 边界 ) 来 表示 区 域 , 或 2) 根据 其 内 部 特征 (如 组 成 该 区 域 的 像素 ) 表 示 区 域 。 然而 , 选择 表 
示 方 案 仅 是 使 得 数据 适用 于 计算 机 的 一 部 分 。 下 一 项 任务 是 基于 所 选择 的 表示 来 描述 区 域 。 例 如 ， 区 
域 可 由 其 边界 表示 ， 边 界 可 用 特征 对 其 进行 描述 ， 如 长 度 、 连 接 端 点 的 直线 的 方向 ， 以 及 边界 上 凹陷 
的 数量 。 

当 我 们 关注 的 重点 是 形状 特征 时 ， 可 选择 一 种 外 部 表示 ; 而 当 关 注 的 重点 是 内 部 属性 如 颜色 和 
纹理 时 ， 可 以 选择 一 种 内 部 表示 。 有 时 ， 需 要 同时 使 用 这 两 种 表示 。 无 论 哪 种 情形 ， 选 择 用 来 作为 
描绘 子 的 特征 都 应 尽 可 能 地 对 大 小 、 平 移 和 旋转 不 敏感 。 本 章 中 讨论 的 多 数 描绘 子 满足 一 种 或 多 种 
这 样 的 特性 。 


11.1 表示 


第 10 章 中 讨论 的 分 割 技术 以 沿 着 边界 或 包含 在 区 域 中 的 像素 的 形式 产生 原始 数据 。 标 准 做 法 是 
使 用 某 种 方案 将 分 割 后 的 数据 精简 为 便于 描绘 子 计算 的 表示 。 本 节 讨 论 各 种 表示 方法 。 


11.1.1 边界 追踪 


本 章 中 讨论 的 几 个 算法 要 求 一 个 区 域 的 边界 上 的 点 以 顺 时 针 (或 逆 时 针 ) 方 向 排序 。 因 此 ， 我 们 通 
过 介绍 边界 跟踪 算法 开始 我 们 的 讨论 ， 该 算法 的 输出 是 排 过 序 的 点 的 
序列 。 我 们 假设 : (1) 处 理 的 是 二 值 图 像 ， 其 目标 和 背景 点 分 别 标 为 1 
和 0; (2) 图 像 已 使 用 值 为 0 的 边界 填充 ， 因 而 消除 了 目标 与 图 像 边界 
合并 的 可 能 性 。 为 方便 起 见 ， 我 们 仅 限 于 讨论 单个 区 域 。 通 过 单独 地 处 理 各 个 区 域 ， 该 方法 可 扩展 到 
817| 多 个 不 相交 的 区 域 。 
818 SE — “RR RHA, EER R 的 边界 或 给 定 边界 的 算法 由 如 下 步骤 组 成 : 
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1. 令 起 始点 bo 为 图 像 中 左上 角 标记 为 1 的 点 ”。 使 用 co 表示 加 西 侧 的 邻 点 [ 见 图 11.1(b) J, 很 明 
显 , oo 总 是 背景 点 。 从 oo 开始 按 顺 时 针 方 向 考察 bo 的 8 个 邻 点 。 令 bi 表示 所 遇 到 的 值 为 1 的 
第 一 个 邻 点 ,并 直接 令 ci (背景 ) 是 序列 中 bi 之 前 的 点 。 存储 bo。 和 bi 的 位 置 ， 以 便 在 步骤 5 中 
使 用 。 

. 令 bp=b 和 c=ci[ 见 图 11.1(e) Js 

.从 c 开 始 按 顺 时 针 方 向 行进 , S 5b 的 8 个 邻 点 为 n,n,，… , ns。 找 到 标 为 1 的 第 一 个 n 。 

. Sbsn, ican, « 


. 重复 步骤 3 和 步骤 4， 直 到 4b =), 且 找 到 的 下 一 个 边界 点 为 b o 
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图 11.1 边界 追踪 算法 前 几 步 的 说 明 。 下 一 个 被 处 理 的 点 标 为 黑色 ， 
而 已 被 处 理 的 点 标 为 灰色 ,算法 找到 的 点 标 为 灰色 方块 


注意 ,步骤 4 中 的 c 总 是 背景 点 ， 因 为 n 是 顺 时 针 扫 描 时 找到 的 第 一 个 1 值 点 。 在 Moore[1968] 
之 后 ， 有 时 该 算法 称 为 Moore 边界 追踪 算法 。 该 算法 的 步骤 5 中 规定 的 停止 规则 并 不 正确 ， 因 为 第 一 
次 停止 时 ， 会 再 次 遇 到 为 。 正 像 我 们 马上 要 了 解 的 那样 ， 这 会 导致 错误 的 结果 。 


图 11.1 显示 了 刚才 讨论 的 边界 追踪 算法 的 前 几 步 。 很 容易 检验 ， 继 续 该 过 程 将 得 到 如 图 11.1(e) 所 


示 的 正确 边界 ， 该 边界 中 的 点 是 一 个 顺 时 针 方 向 排列 的 序列 。 

为 了 解 该 算法 步 又 5 中 规定 的 停止 规则 的 必要 性 ， 考 虑 图 11.2 中 的 边界 。 例 如 ， 不 完全 的 毛刺 去 
除 ( 见 9.5.8 节 有 关 毛 刺 的 说 明 ) 会 导致 边界 上 侧 的 线段 。 从 左上 角 的 点 开始 ， 得 到 所 示 的 步骤 。 在 
图 11.2(c) 中 ,我们 看 到 该 算法 已 回 到 起 始点 。 如 果 步 又 因为 再 次 到 达 起 始点 而 停止 ,那么 显然 不 
会 找到 剩余 的 边界 。 使 用 步 又 5 中 的 停止 规则 可 允许 算法 继续 ， 并 且 显 示 图 11.2 中 找到 的 整个 边 
界 很 简单 。 
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图 11.2” 当 再 次 负 到 起 始点 bolt, 边界 追踪 算法 满足 停止 规则 导致 的 错误 结果 的 说 明 


如 果 给 定 一 个 区 域 而 非 其 边界 (就 像 在 前 述说 明 中 那样 ) ， 那 么 边界 追踪 算法 会 工作 得 很 好 。 也 就 
是 说 , 该 过 程 提取 一 个 二 值 区 域 的 外 边界 。 如 果 目 的 是 找到 一 个 区 域 中 的 孔洞 的 边界 (这 种 边界 称 为 该 
区 域 的 内 边界 ) ， 一 种 简单 的 方法 是 提取 这 些 孔 洞 ( 见 9.5.9 节 )， 并 将 它们 当 作 0 值 背景 上 的 1 值 区 域 
来 处 理 。 对 这 些 区 域 应 用 边界 追踪 算法 将 得 到 原始 区 域 的 内 边界 。 














D 在 本 章 后 面 我 们 会 看 到 ， 边 界 中 的 左上 角 点 有 一 个 重要 性 质 ， 即 该 边界 的 一 个 多 边 形 近 似 在 该 位 置 有 一 个 凸 顶 点 。 此 外 ， 该 点 
的 左上 邻 点 可 保证 为 背景 点 。 这 些 属性 使 得 该 点 成 为 开始 边界 追踪 算法 的 一 个 较 好 的 “标准 ”点 。 
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我 们 已 经 简单 地 说 明了 基于 顺 时 针 方向 跟踪 一 个 边界 的 算法 。 事 实 上 ， 我 们 会 遇 到 按 如 下 假设 来 
进行 表述 的 算法 : 边界 点 已 在 某 个 方向 上 排序 。 在 以 下 几 节 中 ， 我们 将 交替 使 用 两 个 方向 来 帮助 读者 
熟悉 这 两 种 算法 。 


11.1.2 $89 


链 码 用 于 表示 由 顺 次 连接 的 具有 指定 长 度 和 方向 的 直线 段 组 成 的 边界 。 通 常 ， 这 种 表示 基于 这 些 
线段 的 4 连接 或 8 连接 。 每 个 线段 的 方向 使 用 一 种 数字 编号 方案 编码 ， 如 图 11.3 所 示 。 以 这 种 方向 性 
数字 序列 表示 的 编码 称 为 佛 雷 曼 链 码 。 

数字 图 像 通常 以 网 格 形式 来 获取 并 处 理 ， 在 这 种 网 格 形 式 中 ，x 和 了 方向 的 间距 相等 ， 所 以 链 码 
可 以 通过 追踪 一 个 边界 来 产生 ， 也 就 是 说 ， 以 顺 时 针 方向 ， 并 对 连接 每 对 像素 的 线段 赋予 一 个 方 
向 的 方法 产生 。 这 种 方法 通常 不 可 接受 ,原因 有 二 : (1) 得 到 的 链 码 往往 太 长 ，(2) 噪声 或 不 完美 
分 割 沿边 界 引 起 的 任何 较 小 干扰 都 会 导致 编码 的 变化 ， 而 这 种 变化 与 边界 的 主要 形状 特征 可 能 是 
不 相关 的 。 

经 常用 于 解决 这 些 问 题 的 一 种 方法 是 , 选取 一 个 较 大 的 网 格 间距 来 对 边界 重 取 样 ， 如 图 11.4 (a) 
所 示 。 然 后 在 边界 穿 过 网 格 时 ， 将 一 个 边界 点 赋 给 大 网 格 的 一 个 节点 ,具体 取决 于 原始 边界 与 该 节 
点 的 接近 程度 ,如 图 11.4(b) 所 示 。 再 后 , 按 这 种 方法 得 到 的 重 取样 边界 可 由 一 个 4 链 码 或 8 链 码 表 
示 。 图 11.4(c) 显示 了 由 8 方向 链 码 表示 的 粗略 边界 点 。 从 8 链 码 转换 为 4 链 码 或 从 4 链 码 转换 为 8 
链 码 很 简单 (见习 题 2.12 和 习题 2.13) 。 图 11.4(c) 中 的 起 始点 位 于 边界 的 左上 和 角 处 ， 它 给 出 了 链 码 
0766…12。 如 所 期 望 的 那样 ， 结 果 编 码 表示 的 精度 取决 于 取样 网 格 的 间距 。 
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图 11.3 (a)4 方 向 链 码 和 (b)8 方向 链 码 的 方向 编号 
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11.4 OQARA EPERRA (b) 重 取样 的 结果 ; (c) 8 方向 链 码 边界 


边界 的 链 码 取决 于 起 始点 。 然 而 ， 链 码 可 以 通过 一 个 简单 的 过 程 关 于 起 始点 归 一 化 ， 过 程 如 下 : 
我 们 简单 地 将 链 码 视 为 方向 号 码 的 一 个 循环 序列 ， 并 重新 定义 起 始点 ， 以 便 得 到 号 码 序列 的 最 小 整数 


gio] 值 。 我 们 也 可 以 针对 旋转 归 一 化 (使 用 图 11.3 中 方向 的 整数 倍 的 角度 ) ， 方 法 是 使 用 链 码 的 一 次 差分 来 





| 蔡 代 链 码 本 身 。 这 个 差分 是 通过 计算 链 码 中 分 隔 两 个 相 邻 像素 的 方向 变化 的 数 (在 图 11.3 中 按 递 时 针 广 
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向 ) 得 到 的 。 例如, 4 方向 链 码 10103322 的 一 次 差分 为 3133030。 如 果 我 们 把 链 码 作为 循环 序列 来 关于 


起 始点 归 一 化 ， 则 差分 的 第 一 个 元 素 是 通过 使 用 链 码 的 最 后 一 个 元 素 和 第 一 个 元 素 间 的 转变 来 计算 得 
到 的 。 这 里 ， 结 果 是 33133030。 改 变 重 取样 网 格 的 大 小 ， 可 实现 尺寸 归 一 化 

只 有 对 于 旋转 和 尺度 变化 而 边界 本 身 不 变 ( 再 次 强调 ， 按 图 11.3 中 方向 的 整数 倍 角 度 ) 时 ， 这 些 归 
-化 才 是 准确 的 ， 实 际 中 很 少 出 现 这 种 情形 。 例 如 ， 同 一 物体 按 两 个 不 同方 向 数字 化 后 ， 通 常会 有 不 
同 的 边界 形状 ， 不 相似 程度 与 图 像 的 分 辩 率 成 正比 。 按 其 长 度 与 数字 化 图 像 中 像素 间距 离 成 比例 来 选 
择 链 码 ， 和 /或 沿 将 被 编码 物体 的 主轴 ( 见 11.2.2 节 中 的 讨论 ) 或 本 征 轴 ( 见 11.4 节 中 的 讨论 ) 来 选 定 重 取 
样 网 格 的 方向 ， 可 降低 这 种 影响 


例 11.1 佛 雷 曼 链 码 及 它 的 某 些 变 化 。 

图 11.5 (a) 显示 了 小 镜片 中 嵌入 环形 笔画 后 的 图 像 ， 该 图 像 是 大 小 为 570x570 的 8 比特 灰 度 图 像 。 
本 例 的 目的 是 得 到 图 11.5 (a) 的 最 小 值 整数 的 佛 雷 曼 链 码 和 最 大 物体 外 部 边界 的 一 次 差分 ,因为 感 兴 趣 
物体 镶嵌 在 小 镜片 中 , 提取 其 边界 的 结果 将 是 一 条 不 能 描述 该 物体 的 普通 形状 的 带 品 曲线。 图 11.5 (b) 
显示 了 使 用 一 个 大 小 为 9x9 的 均值 模板 平滑 原 图 像 后 的 结果 ， 图 11.5 (c) 是 采用 Otsu 算法 得 到 的 全 局 
阅 值 对 该 图 像 进 行 国 值 处 理 后 的 结果 。 注 意 ， 区 域 数 量 已 减少 到 两 个 (其 中 一 个 区 域 是 一 个 点 ) ， 从 而 
大 大 简化 了 该 问题 。 





图 11.5 (a) 带 噪声 图 像 ，(b) 使 用 一 个 大 小 为 9x9 的 均值 模板 平滑 图 像 后 的 结果 ; (co) 使 
用 Otsu 算法 对 平滑 图 像 进行 闷 值 处 理 后 的 结果 ; (d) 图 (c) 的 最 长 外 部 边界 ; (e) 子 
采样 边界 (为 清楚 起 见 ， 点 已 被 放大 ) ; (使 用 直线 连接 图 (e) 中 的 点 后 的 结果 


图 11.5(d) 是 图 11.5(c) 中 最 大 区 域 的 外 边界 。 直 接 获 得 该 边界 的 链 码 会 生成 一 个 变化 较 小 的 较 长 序列 ， 
且 不 能 表示 该 边界 的 形状 。 如 本 节 之 前 提 到 的 那样 ， 为 降低 可 变性 ， 在 得 到 其 边界 的 链 码 前 ， 通 常 需要 对 
该 边界 重 取样 . 图 11.5(e) 是 以 节点 间距 为 50 像素 ( 约 为 图 像 宽度 的 10%) 的 网 格 对 边界 重 取样 后 的 结果 
图 11.5 ( 仿 是 使 用 直线 连接 所 得 顶点 后 的 结果 。 这 一 简单 近似 保留 了 原始 边界 的 主要 特征 ， 

简化 后 的 边界 的 8 方向 佛 雷 曼 链 人 码 是 

00006066666666444444242222202202 

该 边界 的 起 始点 位 于 子 取样 网 格 中 的 坐标 (2, 5) 处 。 这 是 图 11.5 O 中 的 左上 角 点 。 这 种 情形 下 ， 该 链 

码 的 最 小 值 整数 刚好 与 如 下 链 码 的 最 小 值 整数 相同 : 


821 


822 
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00006066666666444444242222202202 
MeN KEY 
00062600000006000006260000620626 
一 使 用 这 两 种 链 码 之 一 表示 边界 时 ， 可 有 效 地 减少 用 于 存储 该 边界 的 数据 量 s 此 外 ,如 我 们 在 11.2 节 中 
讨论 的 那样 ， 使 用 友 数 可 提供 种 统一 的 方法 来 分 析 边 界 的 形状 。 最 后 ; 记 住 子 采样 边界 可 以 由 上 述 链 码 
之 一 来 恢复 。 


11.1.3 ”使 用 最 小 周 长 多 边 形 的 多 边 形 近似 


数字 边界 可 以 用 多 边 形 以 任意 精度 来 近似 。 对 于 一 条 闭合 边界 ， 当 多 边 形 的 边 数 等 于 边界 上 的 点 
数 时 ， 这 种 近似 会 变 得 很 精确 ， 此 时 ， 每 对 相 邻 的 点 定义 了 多 边 形 的 一 条 边 。 多 边 形 近似 的 目的 是 使 
用 数量 尽 可 能 少 的 线段 来 获取 给 定 边界 的 基本 形状 。 通 常 ， 该 问题 并 不 容易 求解 ， 且 求解 过 程 会 转化 
为 耗 时 的 迭代 搜索 。 然 而 ， 适 度 复杂 的 多 边 形 近 似 技术 还 是 很 适合 于 图 像 处 理 任务 。 在 这 些 近似 技术 
中 ， 最 有 效 的 一 种 技术 是 使 用 最 小 周 长 多 边 形 (MPP) 来 表示 边界 ， 详 见 如 下 讨论 中 的 定义 。 


基础 


产生 计算 MPP 的 算法 的 一 种 直观 方法 是 ， 把 图 11.6 (b) 那 样 的 一 组 连接 单元 的 集合 封 入 图 11.6 (a) 
中 的 一 条 边界 。 我 们 可 以 将 该 边界 想象 为 一 个 橡皮 条 。 人 允许 橡皮 条 收缩 时 ， 橡 皮条 会 受到 由 这 些 单元 
定义 的 边界 区 域 的 内 、 外 墙 的 约束 。 最 终 ， 该 收缩 会 产生 一 个 (关于 这 种 几何 排列 的 ) 最 小 周 长 的 多 边 
形 ， 它 被 限制 在 用 单元 条 封闭 的 区 域内 ， 如 图 11.6(c) 所 示 。 注 意 ， 在 该 图 中 ， 所 有 MPP 的 顶点 与 内 
墙 或 外 墙 的 角 点 一 致 。 


a be 





图 11.6 。”(a) 一 个 物体 的 边界 (黑色 曲线 ) ; (b) th GRED TERED O 允许 边界 
缩 得 到 的 最 小 周 长 多 边 形 。 多 边 形 的 顶点 是 灰色 区 域 的 内 墙角 点 和 外 墙角 点 


单元 的 大 小 决定 着 多 边 形 近似 的 精度 。 在 极限 情况 下 ， 如 果 每 个 (方形 ) 单 元 的 大 小 对 应 于 边界 上 
的 一 个 像素 ， 则 边界 和 MPP 近似 值 之 间 的 每 个 单元 中 的 误差 至 多 为 V2d ， 其 中 d 是 像素 间 的 最 小 可 能 
距离 ( 即 由 原始 取样 边界 的 分 辨 率 决定 的 像素 间 的 距离 ) 。 通 过 强迫 多 边 形 近似 中 的 每 个 单元 的 中 心 为 原 
始 边界 上 的 对 应 像素 ， 可 以 将 该 误差 减 半 。 在 给 定 的 应 用 中 , 我 们 的 目的 是 使 用 合适 的 最 大 可 能 单元 大 
小 ， 以 最 少 的 顶点 数 来 产生 MPP。 在 这 一 节 中 ,我 们 的 目的 是 阐明 寻找 这 些 MPP 顶点 的 过 程 。 

刚才 讨论 的 单元 方法 将 由 原始 边界 包围 的 物体 的 形状 简化 为 图 11.6 (b) 中 由 灰 墙 围 成 的 区 域 。 
11.7 (a) 将 这 一 形状 显示 为 暗 灰色 。 我 们 看 到 ,其 边界 由 4 连接 的 直线 段 组 成 。 假 设 我 们 按 顺 时 针 方 
向 追踪 这 条 边界 ， 追 踪 时 遇 到 的 每 个 转向 要 么 是 一 个 凸 项 点 ， 要 么 是 一 个 止 顶点 ， 其 中 顶点 的 角 是 4 连 
接 边 界 的 内 角 。 凸 项 点 和 四 顶点 在 图 11.7 (b) 中 分 别 显示 为 白 点 和 黑 点 。 注 意 ， 这 些 顶 点 是 图 11.7 (b) 
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中 浅 灰色 边界 区 域 的 内 墙 的 顶点 ， 暗 灰色 区 域 中 的 每 个 四 顶点 ( 黑 点 ) 站 AUTO 
在 浅 灰 色 墙 中 有 一 个 对 应 的 “镜像 ”顶点 ， 镜 像 顶点 位 于 这 个 四 顶 点 “| 定义 了 范围 ww<g<180* 内 的 一 个 
的 对 角 处 。 图 11.7(c) 显示 了 所 有 四 顶点 的 镜像 顶点 ， 为 方便 参考 ， 图 | 角 。 类 似 地 ， 冲 顶点 定义 了 范围 
中 蚕 加 了 图 11.6(c) 中 的 MPP。 我 们 看 到 , MPP 的 顶点 要 么 与 内 墙 中 的 | 380 <2<360 TRAY TAA 180° 


角 定 义 了 一 个 退化 顶点 (一 条 直线 )， 
Oa ( 白 点 ) 一 致 ， 要 么 与 外 墙 中 的 止 顶 点 的 镜像 顶点 ( 黑 点 ) 一 致 。 | 退化 顶点 不 可 能 是 一 个 MMP 顶点 。 


稍 加 思考 就 全 发现， 只 有 内 雯 的 凸 项 点 和 外 寺 的 四 顶点 才能 成 为 MPP |0 360 MZE AKE, te 
的 顶点 。 因 此 ， 我 们 的 算法 就 只 需要 关注 这 些 顶 点 。 SS 





图 11.7 (a) 由 单元 围 成 的 原始 边界 ( 见 图 11.6) 得 到 的 区 域 ( 暗 灰色 ) ; (b) 按 逆 时 针 方向 追踪 暗 灰色 
区 域 的 边界 得 到 的 凸 顶点 CA ek) ETDS ( 黑 点 ) ; Co) 移 到 边界 区 域 的 外 墙 中 对 角 镜 像 位 
置 的 西 顶点 ( 黑 点 ) ， 四 顶点 保持 不 变 。 为 便于 参考 ,图 像 中 释 加 了 MPP (黑色 边界 ) 


MPP 算法 

前 一 段 描述 的 围 成 一 条 数字 边界 的 单元 集合 称 为 单元 组 合体 。 我 们 假设 所 考虑 的 边界 本 身 不 相 
交 ， 这 将 产生 简单 连接 的 单元 组 合体 。 基 于 这 些 假设 ， 并 令 到 ( 白 ) 和 B( 黑 ) 分 别 表示 凸 项 点 和 镜像 叫 
项 点， 我 们 将 观察 结果 说 明 如 下 : 


1. 由 简单 连接 的 单元 组 合体 为 界 的 MPP 是 非 自 相 交 的 。 

2. MPP 的 每 个 凸 顶点 都 是 一 个 历 顶 点 , 但 并 非 边 界 的 每 个 WU ABA MPP 的 一 个 顶点 。 

3. MPP 的 每 个 镜像 止 顶点 都 是 一 个 下 顶点 ， 但 并 非 边界 的 每 个 了 3 顶点 都 是 MPP 的 一 个 顶点 。 

4. 所 有 的 B 顶点 要 么 在 MPP 上 ， 要 么 在 MPP 外 ; 所 有 的 wW MAZA MPP 上 ， 要 么 在 
MPP 内 。 

5. 单元 组 合体 中 包含 的 顶点 序列 的 最 左上 和 角 顶 点 ， 总 是 MPP 的 一 个 不 顶点 。 


这 些 断 言 已 被 正式 证 明 (Sklansky et al.[1972], Sloboda et al.[1998] 和 Klette and Rosenfeld[2004]) 。 
然而 ， 它 们 的 正确 性 对 于 我 们 的 目的 来 说 非常 明显 ( 见 图 11.7) ， 所 以 此 处 对 它们 的 证 明 不 再 闭 述 。 与 
图 11.7 中 上 暗 灰色 区 域 的 顶点 的 角度 不 同 的 是 ，MPP 顶点 维持 不 变 的 角度 不 必 是 90° 的 倍数 。 

在 下 面 的 讨论 中 ,我 们 需要 计算 点 的 三 元 组 的 方向 。 考 虑 点 的 三 元 组 (a, b, c)， 并 令 这 些 点 的 坐标 
H a= (x,y), b = (x3, y2) Me = (25,93) 。 如 果 我 们 以 矩阵 的 行 来 安排 这 些 点 ， 


i | 
x J 1 
X% y, 1 


y= (11.1-1) 








则 由 基本 矩阵 分 析 有 
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>0， 如 果 (a, b,c) 是 一 个 逆 时 针 序列 
det(4) =4= 0， 如 果 点 是 共 线 的 (1-2) 
> 0， 如 果 (a, b, c) 是 一 个 顺 时 针 序 列 


与 右手 坐标 系 有 关 ( 见 2.4.2 节 的 脚注 ) 。 例 如 ， 使 用 该 图 像 坐 标 系 ( 见 | 系 ， 当 按 逆 时 针 方向 追踪 一 个 多 边 形 
Lae Th 5 的 边界 时 ， SRR es UNO AT U 

图 2.18) ,原点 位 于 左上 角 , x 轴 的 正方 向 垂直 向 下 , y 轴 的 正方 向 水 平 | RWI, save neve 

向 右 ， 序 列 a= (3, 4), b= (2, 3) 和 c=, 2) 是 逆 时 针 方 向 ， 并 且 在 代入 有 点 位 于 多 边 形 的 内 部 。 

式 (11.1-2) 中 时 有 det(4) > 0。 故 定义 





sgn(a,b,c) = det( A) (11.1-3) 


来 描述 该 算法 在 符号 表示 上 是 很 方便 的 ， 其 中 ， 对 于 道 时 针 序列 有 sgn(a, b, c)>0， 对 于 顺 时 针 序 列 
有 sgn(a, b, c) <0， 当 点 共 线 时 有 sgn(a, b, c) = 0。 几 何 上 ，sgn(c, b, c) > 0 表明 点 c 位 于 线 对 (a, 5) 的 
正 侧 ( 即 c 位 于 通过 点 a 和 4 的 直线 的 正 侧 ) o Æ sgn(a, 5, cl <0， 则 点 c 位 于 该 直线 的 负 侧 。 如 果 使 
用 序列 (c, a, b)BR(b, c, a)， 那 么 式 (11.1-2) 和 式 (11.1-3) 可 给 出 相同 的 结果 ， 因 为 在 序列 中 追踪 的 方向 
与 (a, b, c) 的 方向 相同 。 然 而 ， 几 何 上 的 解释 是 不 同 的 。 例 如 ，sgn(c, a, b)>0 表明 点 4b 位 于 通过 点 c 
和 a 的 直线 的 正 侧 。 

为 了 给 MPP 算法 准备 数据 ， 我 们 形成 一 个 列表 ， 该 列表 中 的 行 是 每 个 顶点 的 坐标 和 一 个 表示 项 
点 是 丈 顶 点 还 是 下 顶点 的 附加 元 素 。 如 图 11.7(c) 所 示 ， 四 顶点 被 镜像 为 按 顺 序 排列 的 顶点 很 重要 "”. 第 
一 个 顶点 是 左上 角 的 顶点 ， 由 性 质 5 可 知 它 是 MPP 的 下 顶点 。 今 克 表 示 这 个 顶点 。 我 们 假设 顶点 按 
WET HE. SER MPP 的 算法 使 用 两 个 “的 行 ”点 : 一 个 白色 的 候 行 点 (WW ) 和 一 个 黑色 的 谍 行 
点 (Bc )o We TUA(WIIT, Be 沿 镜像 四 顶点 (B) 朴 行 。 这 两 个 疏 行 点 、 找 到 的 最 后 一 个 MPP 项 
点 和 正 被 考察 的 顶点 ， 都 是 实现 该 过 程 所 必需 的 顶点 。 

BIE IES Wo = Bo =V (回忆 可 知 ， 历 是 一 个 MPP 顶点 ) 。 然 后 ， 在 算法 的 任何 步骤 中 , SV, 
表示 找到 的 最 后 一 个 MPP 顶点 , OV, 表示 正在 考察 的 当前 项 点 。 在 天, 和 两 个 息 行 点 之 间 存 在 如 
下 三 个 条 件 之 一 : 

(a) 克 位 于 通过 (V, We) 的 直线 的 正 侧 , 即 sgn(V, We, Vi.) >0 6 

b) 位 于 通过 (Vi,, We) 的 直线 的 负 侧 , 或 所 与 (Vi, We) FER, Msg, We, Vs 0。 同 时 ， 

位 于 通过 (Vi ,B6) 的 直线 的 正 侧 , 或 与 (V1 ,Bc) 共 线 , Bi sgn(V,,BeV, 2 0 o 

(c) 位 于 通过 (Vi, B) 的 直线 的 负 侧 ， 即 sgn(W, Bo, V,)<0. 


如 果 条 件 (a) 成立， 则 下 一 个 MPP 顶点 是 W, ， 并 且 我 们 令 矿 = Wi ; 然后 ,我 们 令 政 = Be =V, X% 
重新 初始 化 该 算法 ， 并 在 太 之 后 的 下 一 个 顶点 继续 执行 算法 。 


Ta), Wow. =v, ; BW, RE Be =V, 。 然 后 ,我 们 使 用 列表 中 的 下 一 个 顶点 继续 执行 算法 。 
如 果 条 件 (c) 成 立 ， 则 下 一 个 MPP 顶点 是 到 ， 并 且 令 万 = Bo; R, RITS Wo = B =V, RE 
新 初始 化 该 算法 ， 并 用 六 之 后 的 下 一 个 顶点 继续 执行 算法 。 
再 次 到 达 第 一 个 顶点 时 , 算法 结束 ,此 时 算法 已 处 理 了 多 边 形 中 的 所 有 顶点 。 算法 找到 的 玉 顶点 
是 MPP 的 顶点 。 业 已 证 明 ， 该 算法 可 找到 一 个 被 简单 连接 的 单元 组 合体 围 成 的 多 边 形 的 所 有 MPP 顶 
点 (Sloboda et al.[1998], Klette and Rosenfeld[2004]) 。 


D 一 个 边界 的 顶点 可 按 算法 追踪 边界 的 方向 排序 ， 例 如 ， 使 用 11.1.1 节 中 描述 的 算法 来 追踪 边界 。 
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例 11.2 MPP 算法 示例 。 
一 个 手 算 例子 有 助 于 阐明 前 面 的 概念 = 考虑 图 14.7(e) 中 的 顶点 。 在 我 们 的 图 像 坐 标 系 中 ,网 格 左上 角 
的 点 的 坐标 是 (0,0)。 假 设 网 格 间距 为 1， 则 ( 逆 时 针 ) 顶点 列表 中 的 前 儿 行 为 


Vo (1,4) 
V (2,3) 
n- eS 
VE E 
A 
SE UN 
Ve (8,2) 
V, (9,2) 
列表 的 第 一 个 元 素 总 是 我 们 的 第 一 个 MPP, AERES W =Bc= 太 = 所 =(1,4) 。 下 一 个 顶点 是 
V,=(2, 3) 。 由 符号 函数 计算 得 sgn( 扩 ,多 ,也 )=0 和 sgn(W, Be, 万 )=0， 因 此 ， 条件 (b) 成 立 。 因 为 乒 是 
一 个 BFL) TLR, FATS Bc =V = (2,3) 2 We 保持 不 变 。 在 这 一 阶段 ， MAT Wo EFU, 4AE, MEATS Be 
fF (2, 34E, TV, 仍 位 于 (下 有 多 处， 因为 未 找到 新 的 MPP 顶点 。 
FH, RIZEN, =(3,3) 的 情形 。 符 号 函数 的 值 是 sgn( 态 , 歼 - 态 )=0 和 sgn( 态 ,有 ,及 )=1 ， 所 以 算法 
的 条 件 (b) 再 次 成 立 。 因 为 万 是 一 个 WO) 顶点 ， 我 们 令 所 = 万 =(3,3) 。 在 这 一 阶段 ， 疏 行 点 位 于 
ee 3) 和 B=(2,3) 处 ; Ti 保持 不 变 。 
一 个 顶点 是 态 =(3,2)。 符号 函数 的 值 是 sent, We, Vs) = -2 和 spay Bo») = -0 ， 因 此 条 件 (b) 
E AAE MA, 我 们 将 黑色 人 和 行 点 更 新 为 He = (3,2) o MOAT We TRIGA, VAR 
持 不 变 
T Ni HEV, = (4, D, BA a )=-3 oe ie 0, 因此 条 件 (b) 再 次 成 并 。 因 为 
是 一 个 白色 顶点 ,我 们 将 自 色 让 行 点 更 新 为 .=(4,1) . BEETA Be 保持 在 3, 2) 处 ，V 仍 位 于 
(1 4) 处 。 
下 一 个 顶点 是 态 =(7.D) ， 且 sgn(V,Wi, 万 )=9 ， 因 此 条 件 (a) 成立 ， FAIS VV, =W = (4,1) 。 因 为 找 
到 了 一 个 新 的 eke 因此 我 们 令 aon Bo=V, sa ait 并 使 用 新 近 找 到 的 玉 后 的 下 一 个 


Svag 


使 用 K= Gay ‘a š p ‘ B 的 新 值 ， NA, sgn(V,, Wo, V) = 0 Mlsgn(V,, Be, Vs) =0 , ARLE (b) 
成 立 。 因 此 , RITS We =V; =(07,), AAV ET WTA. 

FTE, = (8,2), Esga, Wo Vs) =3, MARIE (a) R RE, 我 们 令 V =Wo=(7,1), 
并 通过 令 Wo = Be =V, 来 重新 初始 化 算法 。 

因为 在 (7,1) 处 重新 初始 化 ， 故 下 一 个 要 考虑 的 项 点 再 次 为 =(8,2)。 按 上 面 的 方法 继续 处 理 该 硕 点 
及 剩 下 的 顶点 , 可 得 到 图 11.7(c) 中 的 MPP 顶点 。 如 早 些 时 候 提 到 的 那样 , 位 于 (2, 3) 处 和 (3, 2) 处 及 位 于 (13， 
10) 处 右 下 方 的 镜像 B 顶点 是 共 线 的 ， 尽管 它们 位 于 MPP 的 边界 上 ,但 不 能 视 为 MPP 的 项 点。 这 是 合适 
的 ， 算 法 的 确 没 有 这 样 检测 它们 。 


例 11.3 MPP 算法 的 应 用 。 

图 11.8(a) 是 一 幅 大 小 为 566x566 的 枫叶 二 值 图 像 ， 图 11.8 (b) 是 其 8 连接 边界 。 图 11.8 (c) 到 (e) 中 的 
序列 图 像 显 示 了 该 边界 使 用 大 小 分 别 为 2, 3, 4, 6, 8, 16 #32 的 方形 单元 组 合体 的 MPP 表示 (每 幅 图 中 的 顶 
点 都 用 直线 连接 起 来 形成 一 个 闭合 的 边界 ) 。 枫 叶 有 两 个 主要 特征 : 蔡 和 三 个 主要 的 圆 裂 片 。 如 图 11.8 
所 示 ， 当 单元 尺寸 大 于 4x4 时 ， 茎 开始 消失 。 而 即使 是 对 于 大 小 为 16x16 的 单元 尺寸 ， 仍 完好 地 保留 了 
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三 个 主要 的 圆 裂 片 ， 如 图 11.8 (b) 所 示 。 然而， 在 图 11.8 外 中 ,我 们 看 到 当 单元 尺寸 增 大 到 32x32 时 ， 
一 明显 的 特征 也 几乎 消失 。 

原始 边界 [ 见 图 11.8(b) ] 中 的 点 数 是 1900, 图 11.8 (c) 到 他 中 的 顶点 数 分 别 是 206, 160, 127, 92, 66, 32 
和 13。 尽 管 将 数据 量 降低 了 90% 以 上 ， 但 有 127 个 顶点 的 图 11.8(e) 仍 保留 了 原始 边界 的 所 有 主要 特征 ,。 
由 此 我 们 可 以 看 出 使 用 MPP 来 表示 边界 的 明显 优势 。MPP 的 另 一 个 优点 是 可 以 进行 边界 平滑 。 如 前 节 中 
解释 的 那样 ， 当 我 们 使 用 链 码 来 表示 一 条 边界 时 ， 通 常 需要 进行 边界 平滑 。 





图 11.8 (a) 大 小 为 566x566 的 二 值 图 像 ，(b) 8 连接 边界 ;，(c)~ 人 使 用 大 小 分 别 为 2, 3, 4, 6, 8, 16 
和 32 的 方形 单元 得 到 的 MPP (为 显示 方便 , 用 直线 将 这 些 顶 点 连接 起 来 ) 。 图 (b) 中 边界 
的 顶点 数量 为 1900。 图 (c) 到 图 Gi) 中 的 顶点 数量 分 别 为 206, 160, 127, 92, 66, 32 和 13 


11.1.4 其 他 多 边 形 近 似 方法 

有 时 ， 可 以 用 概念 上 比 前 节 中 讨论 的 MPP 算法 更 简单 的 方法 来 进行 多 边 形 近似 。 本 节 讨 论 两 种 
这 样 的 方法 

聚合 技术 

基于 平均 误差 或 其 他 准则 的 聚合 技术 已 应 用 于 多 边 形 近 似 问 题 。 一 种 方法 是 沿 一 条 边界 来 聚合 
一 些 点 ， 直 到 拟 合 这 些 聚 合 点 的 直线 的 最 小 均 方 误差 超过 某 个 预 设 的 赋 值 。 当 这 种 条 件 出 现时 ， 存 


储 该 直线 的 参数 ， 将 误差 设 为 零 ， 并 日 重复 该 过 程 ， 沿 边界 聚合 新 的 点 ， 直 到 该 误差 再 次 超过 预 设 


的 国 值 。 这 一 过 程 结束 后 ， 相 邻 线段 的 交点 就 构成 多 边 形 的 顶点 。 这 种 方法 的 主要 难点 是 ， 得 到 的 
近似 顶点 并 不 总 是 对 应 于 原始 边界 中 的 形变 (如 拐角 ) ， SR 不 会 开始 画 一 条 新 
的 直线 。 例如 ， 如 果 沿 着 一 条 长 的 直线 追踪 ， 日 遇 到 了 一 个 拐角 ,那么 通过 该 拐角 的 许多 点 (取决 于 


d(H) 在 误差 超过 闭 值 前 将 被 入 弃 。 然而 ， cee) satan -起 的 分 裂 技 术 可 用 于 缓解 
这 一 困难 
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分 裂 技术 


分 裂 边界 线段 的 一 种 方法 是 将 线段 不 断 地 细 分 为 两 部 分 ， 直 到 满足 规定 的 准则 为 止 。 例 如 ,一 个 
要 求 可 能 是 : 一 条 边界 线段 到 连接 其 两 个 端点 的 直线 间 的 最 大 垂直 距离 不 超过 一 个 预 设 的 冰 值 。 如 果 
准则 满足 ， 则 与 直线 有 着 最 大 距离 的 点 就 成 为 一 个 顶点， 这 样 就 将 初始 线段 分 成 了 两 条 子 线段 。 这 种 
方法 在 寻找 变化 显著 的 点 时 具有 优势 。 对 一 条 闭合 边界 ， 最 好 的 起 始点 通常 是 边界 上 的 两 个 最 远 点 。 
例如 ,图 11.9 (a) 显示 了 一 个 物体 的 边界 ,图 11.9(b) 显示 了 这 条 边界 关于 其 最 远 点 的 细 分 。 标 记 为 c 的 
点 是 顶部 边界 线段 到 直线 ab 的 (年 直 距离 ) 最 远 点 。 类 似 地 ， 点 d 是 底部 线段 上 的 最 远 点。 图 11.9(c) 显示 
了 使 用 分 裂 过 程 后 的 结果 ,所 用 立 值 为 直线 ab 的 长 度 的 0.25 倍 。 由 于 新 边界 线段 上 没有 (到 其 对 应 的 
直线 段 的 ) 垂直 距离 超过 该 闪 值 的 点 ， 故 该 过 程 终止 于 图 11.9(d) 中 的 多 边 形 。 


ab 
eid 


图 11.9 (a) 原始 边界 ; (b) 边 界 被 分 割 为 基于 端点 的 线段 ; (c) 顶点 连接 ; (d) 得 到 的 多 边 形 
11.1.5 ”标记 图 


标记 图 是 边界 的 一 维 函数 表示 ， 它 可 以 使 用 各 种 方式 来 生成 。 一 种 最 简单 的 方法 是 以 角度 函数 的 
形式 画 出 质心 到 边界 的 距离 ,如 图 11.10 所 示 。 然 而 , 不 管 如 何 生 成 标记 图 ， 基本 概念 都 是 将 边界 表示 
简化 为 描述 起 来 可 能 比 原始 二 维 边界 更 简单 的 一 维 函数 。 


ab 
r 


r(0) r(0) 





图 11.10 ”距离 与 角度 标记 图 。 在 图 a) 中 ,x(0) 为 常量 。 在 图 (b) 中， 标记 图 由 重复 
出 现 的 模式 x( 四 =Asec 80 < 0< n/4 Fil (0) = Acsc 0 1/4 < 0 <n/2 构成 
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由 刚才 描述 的 方法 所 生成 的 标记 图 是 平移 不 变 的 ， 但 它们 的 确 取 决 于 旋转 和 缩放 。 通 过 寻找 一 种 
选取 相同 起 始点 来 生成 标记 图 的 方法 ， 可 实现 关于 旋转 的 归 一 化 ， 而 不 用 考虑 形状 的 方向 。 这 样 做 的 
一 种 方法 是 ， 将 距 质心 最 远 的 点 选 为 起 始点 ， 假 设 该 点 对 于 我 们 感 兴趣 的 每 个 形状 而 言 都 是 唯一 的 。 
另 一 种 方法 是 在 本 征 轴 上 选取 ( 见 11.4 节 ) 距 质心 最 远 的 点 。 这 种 方法 的 计算 量 更 大 ， 但 更 为 稳定 ， 
因为 本 征 轴 的 方向 是 使 用 所 有 轮廓 点 确定 的 。 当 然 ， 还 有 一 种 方法 是 获得 该 边界 的 链 码 ， 然 后 使 用 
11.1.2 节 中 讨论 的 方法 ， 假 定 得 到 的 编码 足够 粗糙 ， 以 至 于 旋转 不 会 影响 到 它 的 曲率 

根据 关于 两 个 轴 缩 放 一 致 且 以 等 间隔 9 取样 的 假设 ,形态 大 小 的 变化 会 导致 相应 标记 图 的 幅 值 变 
化 。 对 此 进行 归 一 化 的 一 种 方法 是 ， 对 所 有 函数 进行 缩放 ， 以 便 它们 具有 相同 的 值 域 ， 壁 如 [0, 1]。 这 
种 方法 的 主要 优点 是 简单 ， 但 也 有 潜在 的 严重 缺陷 ， 即 对 整个 函数 的 缩放 只 依赖 于 两 个 值 : 最 小 值 和 

最 大 值 。 如 果 形 状 带 有 噪声 ; 那么 这 种 依赖 性 会 成 为 各 个 物体 的 误差 来 源 。 一 种 更 为 稳定 (但 计算 量 更 
大 ) 的 方法 是 ,将 每 个 样本 除 以 标记 图 的 方差 , 假设 该 方差 不 为 零 [ 就 像 图 11.10(a) 中 的 情形 那样 ] 或 
该 方差 不 会 小 到 造成 计算 困难 。 使 用 方差 会 产生 一 个 可 变 缩放 因子 ， 该 因子 与 尺寸 变化 成 反比 ， 工 作 
pidan o ne, 无 论 使 用 什么 方法 ， 基 本 思想 都 是 消除 对 尺寸 的 依赖 性 ， 同 时 

保持 波形 的 基本 形状 。 


An | 


图 11.11 PAS, EKA A (Obeid. B (e) 和 
图 伸 中 的 水 平 轴 对 应 于 从 0° 到 360? 之 间 的 角度 ， 角 度 增 量 为 1 























距离 与 角度 并 不 是 生成 标记 图 的 唯一 方法 。 例 如 ， 男 一 种 方法 是 ， 沿边 界 行 进 ， 并 对 应 于 边界 
上 的 每 个 点 ， 画 出 边界 线 在 这 一 点 的 切线 和 参考 线 之 间 的 角度 。 得 到 的 标记 图 尽管 不 同 于 图 11.10 
中 的 必 9 曲线 ， 但 却 携带 有 关于 基本 形状 特征 的 信息 。 例 如 ， Te aidat 
的 直线 ， 因 为 此 处 正切 角 为 常数 。 这 种 方法 的 一 种 变 体 是 用 所 谓 的 斜率 密度 函数 作为 标记 图 。 该 隔 
数 是 正切 角 值 的 直方 图 。 由 于 直方 图 是 值 的 密集 程度 的 度量 ， 故 斜率 密度 函数 强烈 地 反应 了 有 具有 恒 
定 正切 角 的 边界 部 分 (直线 段 或 近似 直线 段 ) ， 且 在 角度 快速 变化 的 部 分 (拐角 或 其 他 急剧 弯曲 位 置 ) 
存在 较 深 的 波 谷 

例 11.4 两 个 简单 物体 的 标记 图 。 


a 图 11.11 (a) Fil (b) 显示 了 两 个 二 值 物体 ,图 11.11 (c) 和 (d) 是 它们 的 边界 -图 11.11 Ce) A) "PRAY (A) 
832| 标记 图 以 1° 增 量 在 0 到 360s 的 范围 内 变化 。 标记 图 中 突出 峰值 的 数量 足以 区 分 两 个 物体 的 形状 。 
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11.1.6 边界 线段 


将 边界 分 解 为 线段 通常 是 有 很 用 的 。 分 解 降 低 了 边界 的 复杂 性 ， 从 而 简化 了 描述 过 程 。 当 边界 线 
包含 一 个 或 多 个 携带 形状 信息 的 明显 凹 度 时 ， 这 种 方法 尤其 有 吸引 力 。 此 时 ， 使 用 由 边界 所 围 成 区 域 
的 凸 壳 就 成 为 边界 鲁 棒 分 解 的 有 力 工具 。 

如 9.5.4 节 中 定义 的 那样 ,一 个 任意 集合 S 的 凸 沉 五 是 包含 5 的 最 小 山 集 。 差 集 玉 -5 称 为 集合 $ 
的 凸 缺 D。 为 了 解 如 何 使 用 这 些 概念 来 把 边界 分 成 有 意义 的 线段 ， 考 虑 图 11.12(a) ， 图 中 显示 了 一 个 物 
体 (集合 9) 及 其 凸 缺 (阴影 区 ) 。 区 域 边界 可 以 按 如 下 方式 来 分 割 : 追踪 S 的 轮廓 ， 并 标记 进入 或 离开 
一 个 凸 缺 的 转变 点 。 图 11.12 (b) 显示 了 这 种 情况 下 的 结果 。 注 意 ， 在 原理 上 ， 这 种 方案 与 区 域 大 小 和 
方向 无 关 。 


ab 





图 11.12  (a) 区 域 8$ 及 其 凸 缺 (阴影 区 域 ) ; (b) 被 分 割 的 边界 


实际 上 ， 由 于 数字 化 、 噪 声 和 分 割 的 变形 的 影响 ， 数 字 边 界 往往 是 不 规则 的 。 这 些 影 响 通常 会 导 
致 在 整个 边界 上 有 着 随机 散布 的 无 意义 的 小 凸 缺 。 与 其 试图 通过 后 处 理 分 出 这 些 不 规则 边界 ， 不 如 在 
对 边界 分 割 前 用 普通 方法 平滑 边界 。 有 很 多 方法 可 以 做 到 这 一 点 。 一 种 方法 是 追踪 边界 ， 并 使 用 一 个 
像素 沿 该 边界 的 天 个 相 邻 像素 的 平均 坐标 代替 这 个 像素 的 坐标 。 这 种 方法 适用 于 较 小 的 不 规则 边界 ， 
但 它 耗费 时 间 且 难以 控制 。 较 大 的 磊 值 会 导致 过 度 平滑 ， 而 较 小 的 大 值 在 某 些 边界 线段 可 能 会 使 平滑 
不 够 充分 。 一 种 更 为 稳定 的 技术 是 ， 在 找到 一 个 区 域 的 凸 缺 前 ， 先 使 用 多 边 形 近似 。 我 们 感 兴趣 的 多 
数 数字 边界 都 是 简单 的 多 边 形 (回忆 11.1.3 节 可 知 ,这 些 多 边 形 都 不 是 自 交 又 的 ) -Graham and Yao[1983] 
给 出 了 查找 此 类 多 边 形 的 凸 壳 的 一 种 算法 。 

凸 壳 及 其 凸 缺 的 概念 对 于 描述 整个 区 域 及 其 边界 同样 是 有 用 的 。 例 如 ， 描 述 一 个 区 域 可 以 基于 该 
区 域 的 面积 及 其 凸 缺 的 面积 、 凸 缺 中 的 分 量 数 、 这 些 分 量 的 相对 位 置 等 。 请 回顾 9.5.4 节 中 给 出 的 一 种 
寻找 凸 壳 的 形态 学 算法 。 本 章 未 尾 给 出 的 参考 文献 包含 有 其 他 表述 。 


11.1.7 “骨架 


表示 平面 区 域内 结构 形状 的 一 种 重要 方法 是 将 它 简 化 为 图 形 。 这 种 简化 可 以 通过 一 种 细 化 (也 称 
为 骨架 化 ) 算 法 得 到 该 区 域 的 骨架 来 实现 。 在 大 范围 的 图 像 处 理 问 题 中 , 细 化 过 程 起 着 核心 作用 ,从 印 
制 电路 板 的 自动 检测 到 空气 过 滤器 中 的 石棉 纤维 的 计数 。 我 们 在 9.5.7 节 中 已 经 讨论 过 使 用 形态 学 来 骨 
架 化 的 基础 知识 。 然 而 ， 如 那 一 节 中 解释 的 那样 ， 所 讨论 的 过 程 对 保持 骨架 连接 未 做 规定 。 这 里 给 出 
的 算法 可 纠正 这 一 问题 。 

一 个 区 域 的 骨架 可 以 用 Blum[1967] 提 出 的 中 轴 变 换 (MAT) 来 定义 。 边界 为 8 KER R ÉY MAT 如 

下 所 示 。 对 中 的 每 个 点 p， 我们 在 B 中 找到 与 其 最 接近 的 邻 点 。 如 果 p 有 和 多 个 这 样 的 邻 点 ， 则 认为 和 

pa ne ie whee 图 11.13 E 
显示 了 使 用 欧 氏 距离 的 一 些 例子 。 使 用 9.5.7 节 中 的 最 大 圆 盘 可 得 到 相同 的 结果 
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图 11.13 三 个 简单 区 域 的 中 轴 (虚线 ) 


区 域 的 MAT 有 一 个 直观 的 定义 ,该 定义 基于 所 谓 的 “草原 之 火 概念 ”"。 我 们 将 一 个 图 像 区 域 想象 
为 由 干草 组 成 的 平坦 大 草原 ， 且 假设 沿 草原 边界 点 火 。 火 线 以 相同 的 速度 向 区 域 中 心 推 进 。 区 域 的 
MAT 是 同一 时 间 多 个 火线 到 达 点 的 集合 。 

尽管 一 个 区 域 的 MAT 会 生成 直觉 上 令 人 满意 的 骨架 ， 但 直接 实现 这 一 定义 需要 大 量 的 计算 。 实 现 涉 
及 计算 每 个 内 部 点 到 一 个 区 域 边界 上 的 每 个 点 的 距离 。 为 改善 计算 效率 ， 同 时 试图 产生 一 个 区 域 的 中 轴 表 
示 ， 人 们 提出 了 许多 算法 。 通 常 ， 这 些 算法 是 迭代 删除 一 个 区 域 的 边界 点 的 细 化 算法 ， 删 除 这 些 点 时 要 满 
足 如 下 约束 条 件 : (1) 不 能 删除 端点 ，(2) 不 能 破坏 连接 性 ，(3) 不 能 导致 区 域 的 过 度 腐蚀 。 

本 节 给 出 细 化 二 值 区 域 的 一 种 算法 。 假 设 区 域 点 的 值 为 1， 背 景点 的 值 为 0。 这 种 方法 是 对 给 定 
区 域 的 边界 点 连续 应 用 两 个 基本 步骤 , 这 里 ,基于 2.5.2 节 中 给 出 的 定义 , 边界 点 是 值 为 1 且 至 少 有 一 
个 相 邻 像素 的 值 为 0 的 像素 。 参考 图 11.14 中 的 8 邻 域 表示 ， 如 果 满 足 如 下 条 件 ， 则 步 又 1 将 一 个 轮廓 
点 pi 标 为 要 删除 的 点 : 


(a)2 < Np) < 6 

(b) TepD=1l 

(c) p2. Pp4s p= 0 

(d) p4 pes ps =0 (11.1-4) 
UP, NM pice p 的 非 零 相 邻 像素 数量 ， 即 

Np.) = p2 + p3 +++ ps + po (11.1-5) 

其 中 ， Pi 要 么 为 0, BAW LS 而 T pi1) 是 排序 序列 po, ps,:…，, Ps, Pos P2 中 从 0 到 | 1 转换 的 次 数 。 例如 ， 
在 图 11.15 中 , A Np) =4 All T(p)) =3. 





图 1115 式 (11.1-4) 中 条 件 (al 和 (b) 的 说 
图 11.14 细 化 算法 所 用 的 邻 域 像素 排列 明 。 此 时 , N(p)=4 H T(p)=3 
在 步骤 2 中， 条件 (a) 和 (b) 保 持 不 变 , 但 条 件 (c) 和 (d) 变 为 
(c') poepaeps=0 
(d') P2% Pse ps=0 (11.1-6) 
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把 步骤 1 用 于 所 考虑 二 值 区 域 的 每 个 边界 像素 。 如 果 违 反 了 条 件 (a) 到 (qd) 中 的 一 个 或 多 个 ， 则 所 
讨论 点 的 值 不 变 。 如 果 满足 所 有 的 条 件 ， 则 将 该 点 标记 为 删除 点 ,但 该 点 要 等 到 人 处理 完 所 有 边界 点 后 
才能 删除 。 这 种 延迟 可 防止 算法 执行 期 间 对 数据 结构 的 更 改 。 在 对 所 有 的 边界 点 应 用 步骤 1 后 ， 删 除 
已 标记 点 ( 改 为 0 值 ) 。 然 后 ， 按 与 步骤 1 完全 相同 的 方式 ， 对 所 得 结果 应 用 步骤 2。 

这 样 ， 细 化 算法 的 一 次 迭代 就 由 如 下 步骤 组 成 : (1) 应 用 步骤 1， 标 记 待 删除 的 边界 点 ; (2) 删除 
已 标记 点 ; (3) 应 用 步骤 2 来 标记 剩余 的 待 删除 边界 点 ; (4) 删除 已 标记 点 。 反 复 应 用 这 个 基本 过 程 ， 
直到 再 也 没有 待 删除 的 点 为 止 ， 此 时 算法 终止 ， 生 成 了 该 区 域 的 骨架 。 

HERRA p WA 1 个 或 7 个 值 为 1 的 邻 域 点 时 ， 就 违反 了 条 件 (a) 。 仅 有 一 个 这 样 的 邻 点 意味 着 
PD! 是 一 个 骨架 笔画 的 端点 , 显然 不 能 删除 这 个 点 。 如果 p! 有 7 个 这 样 的 邻 点 , 则 删除 pi 会 对 该 区 域 产生 
腐蚀 。 当 对 宽度 为 | 像素 的 笔画 上 的 点 应 用 这 种 方法 时 ， 就 违反 了 条 件 (b) 。 因 此 ,该 条 件 在 细 化 操作 
期 间 就 防止 了 骨架 线段 的 断裂 。 值 的 最 小 集合 (zj = 0 BK pg = 0) BK (p = 0 All ps = 0) FIRR ARF (c) A (d) 。 
这 样 ， 参 考 图 11.14 中 的 邻 域 排列 ， 满 足 这 些 条 件 及 条 件 (al 和 (b) 的 点 ， 就 是 边界 中 的 一 个 东边 界 点 或 
南边 界 点 ， 或 边界 中 西北 角 的 点 。 无 论 哪 种 情况 ，p' 都 不 是 骨架 的 一 部 分 ， 应 被 删除 。 类 似 地 ， 下 列 值 
的 最 小 集合 bp,=0 或 ps=00) 或 (ps=0 和 pe=0) 同 时 满足 条 件 (c) 和 (d)， 它 们 对 应 于 北边 界 点 或 西边 界 
点 , 或 一 个 东南 角 点 。 注 意 ， 东 北角 点 有 ps=0 和 p4=0， 既 满足 条 件 (c) 和 (d) ， 也 满足 条 件 (c) 和 (d) 。 
对 于 西南 角 点 有 pe=0 和 ps=0， 故 也 满足 前 述 条 件 。 


例 11.5 一 个 区 域 的 骨架 。 

图 11.16 显示 了 人 腿 骨 的 一 幅 分 割 图像 ， 并 倒 加 了 该 区 域 的 骨架 。 在 很 
大 程度 上 , 该 骨架 直观 上 看 起 来 是 正确 的 。 在 骨头 的 右 “ 肩 ” 处 有 两 个 分 支 ， 
乍 看 之 下 ， 与 左 侧 相对 应 ,我 们 认为 此 处 应 只 有 一 个 分 支 。 但 要 注意 的 是 ， 
(在 长 方向 上 ) 右 肩 要 比 左肩 稍 宽 , 这 就 是 算法 产生 两 个 分 支 的 原因 。 在 骨架 
处 理 算法 中 ,这 种 不 可 预测 的 行为 很 常见 。 








图 11.16 ASRS AE Br 
s HLA 
11.2 ”边界 描绘 子 示 区 域 上 的 骨架 


本 节 我 们 考虑 几 种 描绘 区 域 边界 的 方法 , 在 11.3 节 , 我 们 重点 关注 区 域 描绘 子 。11.4 节 和 11.5 
节 中 的 部 分 内 容 既 适用 于 边界 也 适用 于 区 域 。 

11.2.1 一 些 简单 的 描绘 子 

边界 的 长 度 是 其 最 简单 的 描绘 子 之 一 。 一 条 边界 上 的 像素 数量 可 以 给 出 其 长 度 的 粗略 近似 。 对 于 
在 两 个 方向 上 以 单位 间距 定义 的 链 码 曲线 ， 垂 直 分 量 和 水 平分 量 的 数量 加 上 对 角 分 量 的 V2 倍 ， 可 给 
出 曲线 的 准确 长 度 。 i 

边界 B 的 直径 定义 为 

Diam(B) = max[D(p;, p;)] (11.2-1) 

式 中 , D 是 一 种 距离 测度 ( 见 2.5.3 节 ) , p; 和 pp; 是 边界 上 的 点 。 直 径 的 值 和 连接 组 成 该 直径 的 两 个 端点 
的 直线 段 (该 直线 称 为 边界 的 长 轴 ) 的 方向 是 边界 的 有 用 描绘 子 。 边 界 的 短 轴 定 义 为 与 长 轴 垂 直 的 直线 。 
由 边界 与 两 个 轴 相 交 的 4 个 外 部 点 所 组 成 的 方 框 这 样 的 长 度 ”, 可 以 完全 包围 该 边界 。 刚刚 描述 的 这 个 
方 框 称 为 基本 和 矩形， 长 轴 与 短 轴 之 比 称 为 边界 的 偏心 举 。 偏 心率 也 是 一 个 有 用 的 描绘 子 。 

曲率 定义 为 斜率 的 变化 率 。 一 般 来 说 ， 获 得 数字 边界 上 某 个 点 处 曲率 的 可 靠 测度 较为 困难 ， 因 为 


D 不 要 将 长 轴 和 短 轴 与 11.4 节 中 定义 的 本 征 轴 混 淆 - 
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这 些 边界 往往 都 是 局 部 “粗糙 的 "。 然 而 , 有 时 使 用 相 邻 边界 线段 的 斜率 差 作为 这 两 条 线段 交点 处 曲率 


的 描绘 子 ， 被 证 明 是 有 用 的 。 例 如 ， 借 用 图 11.6(c) 所 示 边 界 的 顶点 本 身 也 可 以 很 好 地 描述 曲率 。 在 边 

界 上 顺 时 针 方 向 移动 时 ， 如 果 点 p 处 的 斜率 变化 非 负 ， 则 称 项 点 p 是 是 线段 的 一 部 分 ; 否则 , 称 p 属 

于 止 线 段 。 使 用 斜率 变化 范围 ， 可 使 某 个 点 处 的 曲率 更 为 精确 。 例 如 ， 如 果 和 斜率 变化 小 于 10"， 则 认 

为 p 是 一 条 近似 直线 线段 的 一 部 分 ; 如果 斜率 变化 超过 90>?， 则 认为 p 是 一 个 角 点 。 必 须 小 心 使 用 这 
些 描绘 子 ， 因 为 它们 的 解释 取决 于 单条 线段 相对 于 整个 边界 的 长 度 。 


11.2.2 ”形状 数 


如 11.1.2 节 中 解释 的 那样 , 链 码 边界 的 一 次 差分 取决 于 起 始点 。 一 条 基于 图 11.3 (a) 所 示 四 方向 编 
码 的 边界 的 形状 数 ， 定 义 为 最 小 量 级 的 一 次 差分 。 形 状 数 的 阶 n 定义 为 其 表示 的 数字 个 数 。 此 外 ， 对 
于 闭合 边界 ,7 为 偶数 ， 其 值 限制 了 不 同形 状 的 数量 。 图 11.17 显示 了 阶 为 4 6, 8 的 所 有 形状 ， 以 及 它 
们 的 链 码 表 示 、 一 次 差分 和 相应 的 形状 数 。 注 意 , 一 次 差分 是 通过 将 链 码 作为 循环 序列 来 计算 得 到 的 ， 
PEIL 11.1.2 节 。 尽 管 链 码 的 一 次 差分 与 旋转 无 关 ， 但 总 体 而 言 ， 已 编码 的 边界 取决 于 网 格 的 方向 。 归 
一 化 网 格 方向 的 一 种 方法 是 ， 使 用 前 一 节 中 定义 的 基本 矩形 的 边 对 准 链 码 网 格 。 


阶 4 阶 6 
EE 
链 码 : 03 2 1 Gio S,.2. 2° 1 
5 373, 33:3 a0 3.3, 0 3 
形状 数 : 3 3 3 3 033 0.3 3 
Br 8 


em: 00332211 03032211 00.20. :3°2: 2 2 1 
Zy: S03 CS 030 IT SC0S3 003 
CRS: 0303 03 03 OF OS PPSs* "OSS 0035 3 


图 11.17 阶 为 4,6 和 8 的 所 有 形状 。 方 向 来 自 于 图 11.3 (a), ， 黑 点 表示 起 始点 


实际 上 ， 对 于 一 个 期 望 形状 的 阶 ， 我们 要 找到 阶 为 n 的 和 矩形， 该 矩 形 的 偏心 率 ( 见 前 节 的 定义 ) 最 
接近 基本 和 矩形， 并 使 用 这 个 新 矩形 来 建立 网 格 尺 寸 。 例 如 ， 如 果 半 = 12， 则 阶 为 12 的 所 有 和 撼 形 ( 即 周 
长 为 12 的 矩形 ) 是 2x4, 3x3 和 1x5。 如果 2x4 矩形 的 偏心 率 最 匹配 一 个 给 定 边 界 的 基本 和 矩形 的 偏心 率 ， 
那么 我 们 以 这 个 基本 和 矩形 为 中 心 建立 一 个 2x4 网 格 ， 并 使 用 11.1.2 节 中 给 出 的 过 程 来 得 到 链 码 。 形 状 
数 是 根据 该 编码 的 一 次 差分 得 出 的 。 尽 管 选 取 网 格 间距 的 方式 通常 会 使 得 形状 数 的 阶 等 于 n, IRF 
该 间距 的 边界 有 时 会 产生 阶 大 于 n 的 形状 数 。 此 时 ,我 们 指定 阶 数 小 于 的 一 个 和 矩形， 并且 重复 该 过 
程 ， 直 到 所 得 形状 数 的 阶 为 n。 





形状 数 。 

中 的 边界 指定 的 阶 为 n la 。 为 得 到 该 阶 数 的 形状 数 ， 我 们 需要 按照 刚才 讨论 的 下 列 
- 步 是 找到 基本 矩形 ， 如 图 1 18 (b) 所 示 。 阶 为 18 的 最 接近 矩形 为 3x6 矩形 ,这 时 要 求 按 
图 1 if 18 (那样 细 分 该 基本 短 形 ， 其 中 链 码 方向 与 所 得 到 的 网 格 对 齐 。 最 后 一 步 是 得 到 链 码 ， 并 使 用 该 链 
码 的 一 次 差分 来 计算 形状 数 ， 如 图 11.18(d) 所 示 。 me 
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图 11.18 ”生成 形状 数 的 步骤 


11.2.3“ 傅 里 时 描绘 子 


图 11.19 显 示 了 驰 平 面 内 的 一 个 点 数字 边界 。 从 任意 点 Go yo) 开始， 以 道 时 针 方 向 在 该 边界 上 
行进 时 , 会 遇 到 坐标 对 (Go, Vo), Co, V1), Cz 六)… ,Xk Veto 这 些 坐标 可 以 表示 为 xD) = xy, VK) = yy H 
形式 。 使 用 这 种 表示 法 ,边界 本 身 可 以 表示 为 坐标 序列 stk) = [x(k), VAD], k=0, 1 2,…, 开 =- 1。 此 外 , 每 
个 坐标 对 可 当 作 一 个 复数 来 处 理 ， 即 

s(k) = x(k) + jy(k) (11.2-2) 


式 中 =0, 1.2,…: 天 - 1。 也 就 是 说 ,x 轴 为 复数 序列 的 实 轴 ， 
y 轴 为 复数 序列 的 虚 轴 。 尽 管 对 该 序列 的 解释 是 全 新 的 ， 但 
边界 本 身 的 性 质 并 未 改变 。 当 然 ， 这 种 表示 方法 的 一 大 优点 
是 它 将 二 维 问 题 简化 成 了 一 维 问题 。 

由 式 (4.4-6) 可 知 ，s (K) 的 离散 傅 里 叶 变 换 (DFT) 为 


Jy 





a(u) = Ș s(kje BX (11.2-3) Zofi 
k=0 实 轴 
式 中 x= 0, 1,2,…, KK-1。 复 系数 a(w) 称 为 边界 的 传 里 叶 描 ”图 11.19 一 条 数字 边界 及 其 复 序列 表示 。 
绘 子 。 这 些 系 数 的 傅 里 叶 反 变换 可 恢复 s( 晶 。 也 就 是 说 ， 所 示 点 Co, Yo) 和 点 On, y1) EFF 
由 式 (4.4-7) 有 列 中 (任意 选择 ) 的 前 两 个 点 
1S jonuk//K i 
s(k)= TOR a(u)ei (11.2-4) 


式 中 ,K= 0, 1, 2,-++, K- 1。 然 而 ,假设 仅 使 用 前 P 个 傅 里 叶 系 数 而 不 使 用 所 有 系数 ,这 等 同 于 在 式 (11.2-4) 
中 令 a(w) = 0,u>P-1。 结果 为 s( 有 D 的 如 下 近似 : 


§(k) = = 1S aerer (11.2-5) 
u=0 
式 中 , k=0, 1, 2,…, K- 1。 尽 管 求 S(b) 的 每 个 成 分 时 仅 使 用 了 Po, 但 的 范围 仍 是 从 0 到 KK- 1。 
也 就 是 说 ， 在 近似 边界 中 存在 同样 数量 的 点 ;但 项 数 不 像 在 每 个 点 的 重建 中 那样 多 。 回 顾 第 4 章 中 关 _ 
于 傅 里 叶 变换 的 讨论 可 知 ， 高 频 成 分 说 明 精 细 细 节 ， 而 低频 成 分 决定 全 局 形状 。 因 此 , P 越 小 ， 边 界 
丢失 的 细节 就 越 多 ， 如 下 例 所 示 。 
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例 11.7 ”使 用 傅 里 时 描绘 子 。 

图 11.20(a) 显示 了 一 个 人 的 染色 体 的 边界 ， 该 边界 由 2868 个 点 组 成 。 对 该 边界 使 用 式 (11.2-3) 得 到 了 相应 
的 2868 个 傅 里 叶 描 绘 予 。 本 例 的 目的 是 检验 减少 傅 里 叶 描 绘 子 的 数量 对 重建 边界 的 影响 。 图 11.20(b) 显示 了 使 
用 2868 个 描绘 子 的 一 半 来 重建 的 边界 。 有 趣 的 是 , 我 们 注意 到 ， 该 边界 与 原始 边界 之 间 并 无 明显 的 不 同 
图 11.20 (c) #1) (h) 显示 了 分 别 使 用 2868 个 傅 里 叶 描绘 子 的 10%, 5%, 2.5%, 1.25%, 0.63% 和 0.28% 重 建 的 边界 ,这 
些 百分比 分 别 近 似 等 于 286, 144, 72, 36, 18 和 8 个 描绘 子 , 注意 这 些 数字 已 近似 为 最 接近 的 个 整数 。 这 里 的 重点 
是 18 个 描绘 子 ( 约 为 原来 2868 个 描绘 子 的 百 分 之 一 的 6/10 ) 就 有 效 地 保持 了 原始 边界 的 主要 形状 特征 : 4 个 
较 长 的 突出 部 分 和 2 个 较 深 的 弯曲 部 分 。 图 11.20 (h) 是 使 用 8 个 描绘 子 得 到 的 不 可 接受 的 结果 ， 因 为 霄 失 了 主 

要 特征 。 描 绘 子 进一步 减少 到 4 个 和 2 个 ， 将 分 别 导致 一 个 椭圆 和 一 个 圆 (见习 题 11.13) 。 


如 前 例 所 示 的 那样 ， 少 数 的 傅 里 叶 描绘 子 就 可 用 于 捕获 边界 的 大 体 特 征 。 这 一 性 质 很 有 用 ， 因 为 这 
些 系数 携带 有 形状 信息 。 因 此 , 这些 描绘 子 可 用 做 区 分 不 同 边 界 形状 的 基础 ， 正 如 我 们 在 第 12 章 中 讨论 
的 那样 

我 们 已 多 次 声明 ， 描 绘 子 应 尽 可 能 对 平移 、 旋 转 和 尺度 变化 不 敏感 。 此 时 ,结果 将 取决 于 点 被 处 
理 的 顺序 ， 故 另 一 个 约束 条 件 是 ， 描 绘 子 对 起 始点 应 不 敏感 。 傅 里 叶 描绘 子 并 非 直接 对 这 些 几 何 变化 
不 敏感 ， 但 这 些 参数 的 变化 可 能 与 描绘 子 的 简单 变换 是 相关 的 。 例 如 ， 考 虑 旋转 变换 ， 且 回忆 可 知 ， 
基本 数学 分 析 中 关于 复 平 面 的 原点 将 一 个 点 旋转 86 角 是 通过 乘 以 因子 el 来 实现 的 。 对 S( 昌 的 每 个 点 这 
样 做 ， 就 关于 原点 旋转 了 整个 序列 。 旋 转 后 的 序列 为 (kel? ， 其 傅 里 叶 描绘 子 为 

天 一 ] 


a,(u) = Yi see” muk/K — a(y)e!? (11.2-6) 


k=0 


式 中 ,wx= 0,12,…,K- 1。 因 此 ,旋转 变换 仅 通过 乘 以 一 个 常数 项 ei ， 就 等 同 地 影响 了 所 有 的 系数 





图 11.20 pases 本 的 边界 (2868 个 点 ) ; ~(h) 分 别 使 用 1434, 286, 144, 72, 36, 18 和 8 个 傅 里 时 描 
aes 界 。 这 些 数字 分 adr a 2868 个 点 的 50%, 10%, 5%, 2.5%, 1.25%, 0.63%Fil 0.28% 


表 11.1 总 结 了 经 历 旋转 、 平 移 、 尺 度 和 起 始点 变化 的 边界 序列 SB 的 傅 里 叶 描绘 子 。 符 号 A、 定 义 
H Ay = Ax+ jAy ， 所 以 符号 w( 朋 =s(+A， 将 该 序列 重 定义 (平移 ) 为 
s,(k) =[x(k) + Ax] + j[y(k)+ Ay] (11.2-7) 


换 句 话说 ,平移 是 对 边界 上 的 所 有 坐标 添加 一 个 常数 位 移 。 注意 ,除了 u=0 时 变 为 冲 激 函数 u) 





D 回忆 第 4 章 可 知 ， 常 数 的 傅 里 叶 变换 是 一 个 位 于 原点 的 冲 激 ， 且 该 冲 激 处 处 为 零 
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外 ,平移 变换 对 描绘 子 无 影响 。 最 后 ， 表 达 式 sk) = slk- in) 意味 着 将 序列 重新 定义 为 
Sp = x(k- ko) + jy(k-ko) (11.2-8) 
它 仅 将 序列 的 起 始点 从 k= 0 更 改 为 上 = koo X 11.1 中 的 最 后 一 项 表明 ， 起 始点 的 变化 会 以 不 同 (但 已 
Al) 的 方式 影响 到 所 有 描绘 子 ， 在 这 一 意义 上 说 ， 乘 项 a(w) 取 决 于 uo 
表 11.1 傅 里 时 描绘 子 的 一 些 基 本 性 质 





傅 里 时 描绘 子 











El s(k) a(u) 

旋转 sr(k) =se? aru) = aluje’ 

平移 St( = s(k)+ Ay, at(u) = a(u) + Ayd(u) 
3 ss(k) = as(k) as(u) = aa(u) 






sp(k) = s(k — ko) ap(u) = au) eE 





11.2.4 Sits 


边界 线段 (和 标记 图 波形 ) TAR) ASC ee BR, MAE. DT PEAT. N T fea 
实现 这 种 定量 描述 ,考虑 图 11.21 (a), ， 它 显示 了 一 段 边 界 ， 而 图 11.21 (b) 显示 了 以 任意 变量 > 的 一 维 函 
AC g(n) 描 述 的 线段 。 该 函数 是 这 样 获得 的 : 先 将 该 线段 的 两 个 端点 连接 
起 来 ， 然 后 旋转 该 直线 线段 ， 直 至 其 为 水 平 线段 。 此 时 ， 所 有 点 的 坐 
标 也 旋转 相同 的 角度 。 





g(r) 


attr, 
图 11.21  〈a) 边 界线 段 ; (b) 一 维 函 数 表 示 
让 我 们 将 幅度 g 视 为 一 个 离散 随机 变量 v， 并 形成 一 个 幅度 直方 图 pv), i=0, 1, 2,-++,. 4-1, 其 中 4 
是 我 们 分 割 幅 度 尺 度 的 离散 幅度 增 量 数 。 然 后 ， 记 住 pv) AMAL vi 出 现 的 概率 估计 ， 故 由 式 (3.3-17) 可 知 
关于 其 均值 的 v HIE n MEA 


A-1 
M,(v) = >, -m)" p(v,) (11.2-9) 
i=0 
式 中 ， 
A-1 i 
m= VPC) (11.2-10) 
i=0 


Ht m 为» 的 均值 或 平均 值 ，j, Av 的 方差 。 通 常 ， 仅 使 用 前 几 个 矩 通常 不 能 区 分 明显 不 同形 状 的 信和 号 。 
一 种 替代 方法 是 将 g(D 归 一 化 为 单位 面积 ， 并 把 它 当 作 直 方 图 来 处 理 。 换 名 话说 ，g( 门 现在 作为 
值 六 出 现 的 概率 来 处 理 。 此 时 ，7 为 一 个 随机 变量 ， 故 矩 为 
K-1 
My (r) = >; - m)" g(r) (11.2-11) 
i=0 


式 中 ， 
m=) re(r) (11.2-12) 
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式 中 ,，K 是 边界 上 的 点 数 ，j4( 四 直接 与 g(9) 的 形状 相关 。 例 如 ， 二 阶 矩 jw) 度量 曲线 关于 的 均值 的 
扩展 程度 ， 而 三 阶 矩 ys( 四 度量 曲线 关于 均值 的 对 称 性 。 

基本 上 ， 我们 完成 的 工作 是 将 任务 的 描述 简化 为 一 维 函 数 的 描述 。 尽 管 到 目前 为 止 矩 是 最 流行 的 
方法 ,但 它们 不 是 用 于 此 目的 的 唯一 描绘 子 。 例 如 ， 另 一 种 方法 是 计算 一 维 离散 傅 里 叶 变 换 ， 得 到 其 
频谱 ， 并 使 用 频谱 的 前 4 个 成 分 来 描述 g(r)。 与 其 他 技术 相 比 ， 甜 方法 的 优点 是 和 矩 的 实现 非常 简单 ， 
且 携 带 了 边界 形状 的 “物理 ”解释 。 图 11.21 清 楚 地 表明 了 这 种 方法 对 旋转 的 不 敏感 性 。 需 要 时 ， 通 过 
缩放 g 值 和 7 值 的 范围 ， 可 实现 尺寸 的 归 一 化 。 


11.3 ”区 域 描绘 


本 节 考 虑 几 种 描述 图 像 区 域 的 方法 。 记 住 ， 使 用 边界 和 区 域 相 结合 的 描绘 子 在 实践 中 是 很 普 
WHJ 


11.3.1 一 些 简单 的 描绘 子 


区 域 的 面积 定义 为 该 区 域 中 像素 的 数量 。 区 域 的 周 长 是 其 边界 的 长 度 。 尽 管 面 积 和 周 长 有 时 也 被 
用 做 描绘 子 ， 但 它们 主要 应 用 于 感 兴趣 区 域 尺寸 不 变 的 情形 。 这 两 个 描绘 子 频繁 用 于 度量 一 个 区 域 的 
致密 性 ， 致 密 性 定义 为 ( 周 长 )” 面 积 。 另 一 个 稍微 不 同 的 (标量 乘 子 内 ) 致 密 性 描绘 子 是 圆 度 率 ， 即 一 
个 区 域 的 面积 与 具有 相同 周 长 的 一 个 圆 (最 致密 形状 ) 的 面积 之 比 。 周 长 为 P 的 一 个 圆 的 面积 为 
已 /4r 。 因 此 ， 圆 度 率 尺 .由 下 式 给 出 : 


= 一 一 (11.3-1) 


AP, 4 是 所 讨论 区 域 的 面积 , P 是 其 周 长 。 对 于 圆 形 区 域 , 该 度量 值 为 1， 对 于 方形 区 域 ， 该 度量 值 
为 r/4。 和 致密 性 是 一 个 无 量 纲 的 测度 ， 当 然 ,在 忽略 调整 数字 区 域 大 小 和 旋转 数字 区 域 时 可 能 引入 的 计 
算 误 差 的 情形 下 ， 它 对 均匀 斥 度 变化 和 方向 不 敏感 。 

用 做 区 域 描绘 子 的 其 他 简单 测度 包括 灰 度 级 的 均值 和 中 值 、 最 小 灰 度 值 和 最 大 灰 度 值 ， 以 及 其 值 
高 于 和 低 于 均值 的 像素 数 。 


例 11.8 “使 用 面积 计算 从 图 像 中 提取 信息 。 ， 
Re wo A 






tei 个 区 域 中 积 与 所 有 
度 可 用 区 域 消 耗 的 电能 给 出 相对 售 计 。 MARTRE, ADESEA, 可 进步 





细 化 数据 。 


11.3.2 ”拓扑 描绘 子 


折 站 特性 对 于 图 像 平面 区 域 的 整体 描述 是 很 有 用 的 。 简单 来 说 ， 拓 扑 学 研究 未 受 任何 变形 影响 的 

图 形 的 性 质 , 前 提 是 该 图 形 未 被 撕 裂 或 粘连 (有 时 称 为 橡皮 膜 变 形 ) 。 例 如 , 图 11.23 显示 了 一 个 带 有 两 

个 孔洞 的 区 域 。 如 果 一 个 拓扑 描绘 子 由 该 区 域内 的 孔洞 数量 来 定义 ， 那 么 这 种 性 质 明显 不 受 拉 伸 或 旋 

844| 转变 换 的 影响 。 然 而 ,一般 来 说 ， 如 果 该 区 域 被 撕 裂 或 折 释 ， 那 么 孔洞 数 会 发 生变 化 。 注 意 ， 由 于 拉 
as] 仲 会 影响 距离 ， 故 拓扑 特性 与 距离 或 基于 距离 测度 概念 的 任何 特性 无 关 。 
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另 一 个 对 区 域 描述 有 用 的 拓扑 特性 是 连通 分 量 的 数量 。2.5.2 节 定 义 了 区 域 的 连通 分 量 。 图 11.24 
-一 个 具有 3 个 连通 分 量 的 区 域 ( 关 于 计算 连通 分 量 的 算法 ， 请 参阅 9.5.3 节 ) 
区 域 编号 每 个 区 域 的 灯光 
(从 上 至 下 ) 与 总 灯光 之 比 
l 0.204 
2 0.640 
3 0.049 
4 0.107 
图 11.22 ”夜间 美洲 的 红外 图 像 (图 像 由 NOAA 提供 ) 
a TA N ANG: 
A | | \ {| ) 
% A \ | | N > ' ee 
Lye Sh ) E y ° eee / 
( A A ww 3 | 人 CS | 
图 11.23 带 有 两 个 和 孔洞 的 一 个 区 域 图 11.24 带 有 3 个 连通 分 量 的 一 个 区 域 
图 形 中 孔洞 的 数量 刀 和 连通 分 量 的 数量 C， 可 用 于 定义 欧 拉 数 : 
s (11.3-2) 
欧 拉 数 也 是 一 种 拓扑 特性 。 例如 , 图 11.25 中 所 示 的 区 域 有 分 别 等 于 0 和 - 1 的 欧 拉 数 ,因为 “A” 
'B” 有 一 个 连通 分 量 和 两 个 孔洞 
个 多 边 


有 一 个 连通 分 量 和 一 个 孔洞 ， 而 “ 
使 用 欧 拉 数 , 可 非常 简单 地 解释 由 直线 段 表 示 的 区 域 ( 称 为 多 边 形 网 络 ) 。 图 11.26 显 示 了 一 
形 网 络 syet i u emcee ht 很 重要 。 用 天 表示 顶点 数 , 用 O 表示 边 数 , 用 
845 


ne 
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由 式 (11.3-2) 可 以 看 出 上 式 等 于 欧 拉 数 ， 





V-Q+F=C-H=E (11.3-3) 
图 11.26 中 的 网 络 有 7 个 顶点 、11 条 边 、2 个 面 、1 个 连通 区 域 和 3 个 孔 ， 因 此 欧 拉 数 为 -2: 
F=114+2=1-3=2 
拓扑 描绘 子 提供 了 一 个 附加 特征 ， 该 特征 在 表征 某 个 场景 中 的 区 域 时 通常 很 有 用 























a Y J 
NG or 
J 
图 11.25” 欧 拉 数 分 别 等 于 0 和 -1 的 区 域 图 11.26 包含 一 个 多 边 形 网 络 的 区 域 


1119 ”使 用 连通 分 量 在 已 分 割 图 像 中 提取 最 大 特征 。 

图 11.27(a) 显示 了 美国 华盛顿 特区 的 二 幅 大 小 为 512x512 的 8 比特 图 像 ， 该 图 像 是 由 NASA 的 地 球 资 
W (LANDSAT) 卫星 拍摄 的 。 这 幅 特 殊 的 图 像 是 近 红 外 波段 图 像 ( 详 见 图 1.10). 假设 我 们 只 使 用 这 幅 图 像 来 
分 割 河流 与 使 用 多 光谱 图 像 相 反 , 它 可 简化 任务 ) 。 由 于 河流 在 图 像 中 是 相当 暗 的 均匀 区 域 , 因此 立 值 处 理 
方法 显然 值得 一 试 。 在 使 河流 变 为 一 个 不 连通 区 域 之 前 ， 用 可 能 的 最 高 赣 值 为 图 像 设 置 门限 所 得 的 结果 如 
图 11.27(b) 所 示 。 阔 值 是 人 为 选择 的 ， 这 一 点 说 明 ， 在 这 种 情况 下 ， 没 有 图 像 的 其 他 区 域 出 现在 国 值 化 后 
的 结果 中 ， 仅 依靠 河流 本 身 是 不 可 能 分 割 河流 的 。 本 例 的 目的 是 说 明 如 何 使 用 连通 分 量 来 “完成 ”分 割 。 


abcd 





图 11.27 (a) 华盛顿 特区 的 红外 图 像 ;，(b) 经 阔 值 处 理 后 的 图 像 ; (©) 图 (b) 的 最 大 连通 分 量 ; (d) 图 (c) 的 骨架 


图 11.27(b) 中 的 图 像 有 1591 个 连通 分 量 (使 用 8 连通 得 到 ) , 其 欧 拉 数 为 1552, 由 此 推出 孔洞 数 为 39。 
图 11.27(c) 显示 了 具有 最 大 元 素数 量 (8479) 的 连通 分 量 。 这 是 我 们 期 望 的 结果 ， 因 为 我 们 已 知 使 用 一 个 阅 
值 不 能 从 图 像 中 由 河流 本 身 来 分 割 河流 。 注 意 ， 所 得 结果 非常 清晰 。 如 果 我 们 想 要 度量 河流 的 每 个 支流 的 
KE, 那么 可 以 使 用 该 连通 分 量 的 骨架 [ 见 图 11.27(d) |. 换 名 话说, 骨架 中 每 个 分 支 的 长 度 是 它 所 表示 的 
河流 分 支 长 度 的 合理 近似 。 


11.3.3 ”纹理 


描绘 区 域 的 一 种 重要 方法 是 量化 该 区 域 的 纹理 内 容 。 尽 管 不 存在 纹理 的 正式 定义 , 但 在 直觉 上 ， 
g 这 种 描绘 子 提供 了 诸如 平滑 度 、 粗 糙 度 和 规律 性 等 特性 的 测度 (图 11.28 中 给 出 了 一 些 例子 ) 。 图像 处 理 
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中 用 于 描述 区 域 纹理 的 三 种 主要 方法 是 统计 法 、 结 构 法 和 频谱 法 。 统 计 法 生成 渚 如 平滑 、 粗 糙 、 粒 状 等 纹 


HERMIE. 结构 法 处 理 图 像 像 元 的 排列 , 如 基于 规则 间距 平行 线 的 纹理 描述 。 频谱 法 基于 传 里 叶 频 谱 的 特性 ， 
主要 用 于 检测 图 像 中 的 全 局 周期 性 ， 方 法 是 识别 频谱 中 的 高 能 量 的 罕 波 峰 . 


abc 





图 11.28 上 自 色 方块 从 左 到 右 表 示 平 滑 纹理 、 粗 糙 纹 理 和 规则 纹理 。 图 像 从 左 到 
右 分 别 是 一 块 超导体 、 人 类 胆固醇 和 一 个 微 处 理 器 的 光学 显微镜 图 
像 ( 图 像 由 佛罗里达 州立 大 学 的 Michael W. Davidson 博士 提供 ) 


统计 法 
描述 纹理 的 最 简 方法 之 一 是 使 用 一 幅 图 像 或 一 个 区 域 的 灰 度 级 直方 图 的 统计 和 矩 。 令 = 是 表示 灰 度 的 一 


个 随机 变量 ， 并 令 pe), i = 0, 1 2,…, LA 为 相应 的 直方 图 ， 其 中 工 是 不 同 灰 度 级 的 数量 。 由 式 (3.3-17) 
可 知 ， 关 于 其 均值 的 z 的 第 7 rene 


Ll 
f(z) = > (2 —m)" p(z;) (11.3-4) 


IP, m 是 z 的 均值 (平均 灰 度 ): 
= 


m= >. z;p(z;) (11.3-5) 
=0 


注意 , Fash (113-4) Alo = 1 和 j=0。 SE [方差 o (z) = 4, (z) | 在 纹理 描述 中 特别 重要 。 它 是 

灰 度 对 比 度 的 测度 ， 可 用 于 建立 相对 平滑 度 的 描绘 子 。 例 如 ， 测 度 

1 
1+o0°(z) 
对 于 恒定 灰 度 区 域 为 0( 该 区 域 的 方差 为 零 ) ， 而 对 于 较 大 的 o*(z) 值 ， 其 接近 于 1。 因 为 对 于 灰 度 级 图 
像 , 方差 值 是 随 灰 度 值 增 大 而 增 大 的 ， 例 如 ， 对 于 值 域 为 [0, 255] 的 灰 度 级 图 像 ， 最 好 将 方差 归 一 化 到 
区 间 [0, 1] 内 ， 以 便于 在 式 (11.3-6) 中 使 用 。 在 式 (11.3-6) 中 将 o7”(z) 除 以 (L-1》， 可 实现 这 种 归 一 化 。 
标准 差 o(z) 也 经 常用 做 纹理 的 一 种 测度 ， 因 为 标准 差 的 值 对 于 很 多 人 来 说 更 为 直观 。 

三 阶 矩 





R(z) =1- (11.3-6) 


L-1 
H(z) = >》 (z —m)? p(z;) (11.3-7) 


i=0 
FET El eR A BE, TTPO Es EE A SE ERE Te BREA A HEN AI 
状 联 系 起 来 ， 但 它们 的 确 提供 了 纹理 内 容 的 进一步 分 辨 。 另 外 一 些 有 用 的 、 基 于 直方 图 的 纹理 测度 ， 
包括 由 下 式 给 出 的 “一 致 性 ”测度 : 


849 


~ 


85 


1 


536 数字 图 像 处 理 (第 三 版 ) 


L-1 
U(z)= Ap E) (11.3-8) 
i=0 
APE Ly ea EE 
L-1 
e(z)=-9_ p(z;)log, p(z;) . (113-9) 
i=0 


因为 p 在 区 间 [0, 1] 内 取 值 ， 且 这 些 值 的 和 为 1， 故 测度 U 对 所 有 灰 度 级 都 相等 的 图 像 有 最 大 值 ( 极 大 
一 致 性 ) ， 并 从 最 大 值 开始 降低 。 炳 是 可 变性 的 测度 ， 对 恒定 图 像 其 为 零 。 


例 11.10 基于 直方 图 的 纹理 测度 oo 








与 标准 差 度量 的 内 容 相同 。 三 阶 矩 通常 用 于 确定 

| BEA EIERE CAEL) SE Tae CEI) RRN EE SEI 
(ara EA RN BA RCT, 仅 当 测度 间 的 变化 较 大 时 ， 由 三 阶 矩 导出 的 信息 才 是 有 用 的 。 研 究 一 
致 性 测度 后 ， 我 们 再 次 得 出 结论 ， 第 一 由 子 图 像 更 为 平 清 ( 比 其 他 子 图 像 更 均匀 ) ， 县 最 大 随机 (最 低 一 到 





相同 。 ht 级 变化 最 小 ， ee 





仅 使 用 直方 图 计算 得 到 的 纹理 测度 不 携带 像素 彼此 之 间 的 相对 位 置 的 信息 。 在 描述 纹理 时 ， 这 很 
重要 ， 并 且 将 这 种 类 型 的 信息 合并 到 纹理 分 析 过 程 中 的 一 种 方法 是 ， 不 仅 要 考虑 灰 度 的 分 布 ， 还 要 考 
虑 图 像 中 像素 的 相对 位 置 。 

S 2 是 定义 两 个 像素 彼此 相对 位 置 的 一 个 算 子 ,并 考虑 一 幅 具有 ”| ”注意 ,我 们 正 使 用 灰 度 范围 [1, L] 
L 个 可 能 灰 度 级 的 图 像 上 令 G 为 一 个 矩阵 ， 其 元 素 gy 是 灰 度 为 五 和 ot i eae s p rri 
3 的 像素 对 出 现在 /中 由 O 指定 位 置 处 的 次 数 , 其 中 < ij <L 按 这 | senesesiamsewett 1 wwer G 的 第 
种 方法 形成 的 矩阵 称 为 灰 度 级 (或 灰 度 ) 共生 矩阵 。 当 含义 明确 时 ，G | 一 个 行列 索引 )。 
简单 地 称 为 一 个 共生 拢 阵 。 

图 11.29 显示 了 一 个 如 何 用 元 =8 和 由 “直接 面 对 右 边 的 一 个 像素 ” (一 个 像素 的 相 邻 像素 定义 为 紧 
靠 右边 的 像素 ) 定义 的 位 置 算 子 O 构造 共生 和 矩阵 的 例子 。 左 侧 的 阵列 是 所 考虑 的 小 图 像 ， 右 侧 的 阵列 是 
和 矩阵 G。 我 们 看 到 ，G 的 元 素 (1, 1) 是 1， 因 为 在 了 中 , 值 为 1 的 像素 的 右 侧 值 也 为 1 的 像素 仅 出 现 了 1 
次 。 类 似 地 ，G 的 元 素 (6, 2) 是 3， 因 为 在 了 中 , 值 为 6 的 像素 的 右 侧 值 为 2 的 像素 出 现 了 3 次 。 按 这 种 
方式 ， 可 计算 出 G 的 其 他 元 素 。 例 如 ， 如 果 我 们 已 将 @ 定义 为 “右边 一 个 像素 和 上 面 一 个 像素 "， 则 G 
中 的 位 置 (1, 1) 会 是 0, 因为 在 f 内 由 0 指定 的 位 置 处 不 存在 右边 一 个 1 和 上 面 一 个 1 的 情形 。 另 一 方面 ， 
G 中 的 位 置 (1, 3), (1, 5) 和 (1, 7) 都 是 1， 因 为 在 f 内 由 0 定义 的 位 置 处 ， 右 侧 像 素 分 别 为 3, 5 和 7 的 1 值 
像素 都 出 现 了 1 次 。 作 为 练习 ， 请 你 使 用 O 的 这 个 定义 计算 G 的 所 有 元 素 。 
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图 11.29 生成 共生 和 矩阵 的 方式 


PUR A] RENTER BR cE TIERE G 的 大 小 。 对 于 一 幅 8 比特 图 像 (256 个 可 能 的 灰 度 级 ) ，G 的 
大 小 为 236x256。 使 用 一 个 矩阵 时 ， 这 不 成 问题 , 但 如 例 11.11 中 所 示 ， 有 时 会 使 用 共生 矩阵 序列 。 为 
了 减少 计算 负担 ， 经 常 使 用 的 一 种 方法 是 ,将 灰 度 量化 为 几 段 ， 以 便于 管理 矩阵 G 的 大 小 。 例如， 在 
256 级 灰 度 的 情形 下 ， 通 过 令 前 32 个 灰 度 级 等 于 1, 令 接 下 来 的 32 个 灰 度 级 等 于 2， 以 此 类 推 , 可 完 
成 这 种 量化 工作 。 这 将 得 到 一 个 大 小 为 8x8 的 矩阵 。 

满足 O 的 像素 对 的 总 数 hn， 等 于 G 的 元 素 之 和 (在 上 例 中 n=30)。 因 此 ， 


Py = 8 In 
是 满足 O 的 一 个 值 为 (z,,z,) 的 点 对 的 概率 估计 。 这 些 概率 的 值 域 为 [0, 1]， 且 它们 的 和 为 1: 


K 


Typ, =l 


i=l j=l 
式 中 , KENE G 的 行 (或 列 ) 数 。 

因为 G 取决 于 CO， 所 以 选择 一 个 合适 的 位 置 算 子 并 分 析 G 的 元 素 ， 可 以 检测 灰 度 纹理 模式 的 存在 。 
表 11.3 中 列 出 了 一 组 表征 G 的 内 容 的 有 用 描绘 子 。 ( 表 中 第 三 行 的 ) 相关 描绘 子 中 使 用 的 量 定义 如 下 : 


K K K K 
m, = i Pi > m.= > i>. By 
A =I 


fal Ty j=l i=l 


和 
K K K 
a, => i-my>p,, oe -mY > p, 
i=l j=) j=l i=] 
如 果 我 们 令 
K K 
POE Sp PG) py 
j=l i=l 
则 前 述 公式 可 以 写 为 


K K K K ; 
m=) iP@), m= JPG), oF =dG-myP@, of =>))U-m,) PU) 
i=l j=l i=l j=l 

参考 式 (11.3-4)、 式 (11.3-5) 和 它们 的 解释 , 我们 看 到 m, 是 沿 归 一 化 后 的 G 的 行 计 算 的 均值 ，m。 
是 沿 着 G 的 列 计算 的 均值 。 类 似 地 ，o, 和 .是 分 别 沿 行 和 列 计算 的 标准 差 方差 的 平方 根 ) 。 这 些 项 
都 是 标量 ,与 G 的 大 小 无 关 。 


538 数字 图 像 处 理 ( 第 三 版 ) 


记 住 ， 当 我 们 研究 表 11.3 时 ,“ 邻 居 ” 与 定义 O 的 方式 有 关 ( 即 邻居 不 必 一 定 是 邻近 的 ) , E p 只 
不 过 是 在 /内 像素 发 生 次 数 的 归 一 化 计数 ， 该 像素 具有 灰 度 z Mz, 并 与 O 指定 的 位 置 有 关 。 


表 11.3 用 于 表征 大 小 为 KxK 的 共生 矩阵 特性 的 描绘 子 ， 凡 是 G 的 第 六 项 除 以 G 的 元 素 总 和 的 数 











描 绘 子 解释 A. R 
最 大 概率 度量 G 的 最 强 响 应 ， 值 域 为 [0, 1) aa Pi) 
K K ) 1) 
i -个 像素 在 整个 图 像 上 与 其 邻居 相关 程度 的 测度 。 值 域 是 [1 -1]， 对 应 于 | SO ai” mete 
完美 的 正 相 关 和 完美 的 负 相关 。 若 任意 一 个 标准 差 为 零 ， 则 该 测度 无 定义 | 总 六 
o, #0;0, #0 
. -个 像素 在 整个 图 像 上 与 其 邻居 间 的 灰 度 对 比 的 测度 。 值 域 为 0( 当 G 人 恒定 | SS. 22 
对 比 度 ; (iJ) p; 
+ 比 度 jy Lae iY Py 
K K 
一 致 性 (也 称 为 能 量 ) | 值 域 为 [0, 1] 的 一 致 性 测度 。 对 于 恒定 图 像 ， 一 致 性 为 1 oP 
i=] j=l 
G 中 元 素 对 角 线 分 布 的 空间 紧密 度 的 测度 。 值 域 为 [0, 1], 当 C 是 对 角 和 矩阵 时 ，| SS Py 
oS 其 什 最 大 rp 
1 G 中 元 素 随机 性 的 测度 。 当 所 有 py 项 为 零 时 箭 为 0， 当 所 有 p, SUIT | KA 
Wi -> > py log: P; 
最 大 。 最 大 值 是 2log; K | JUSSFaAYZASK (113-9) J fal fal 





11.11 ERR RT RERE. 


图 11.30 (a) 到 (c) 显示 了 分 别 由 随机 模式 、 水 平 周期 (正弦 ) 模式 和 混合 像素 模式 组 成 的 图 像 。 本 例 有 
两 个 目的 : (1) 对 (从 上 到 下 ) 对 应 于 这 些 图 像 的 3 SEARS G, CA G, WHAK 11.3 中 描绘 子 的 值 ， 
(2) 曾 明 如 何 使 用 共生 和 矩阵 序列 来 检测 图 像 中 的 纹理 模式 。 

图 11.31 以 图 像 形式 显示 了 共生 矩阵 G1, G; 和 Go RIERREN L = 256 和 位 置 算 子 “ 右 侧 紧 邻 一 个 
像素 ”得 到 的 。 在 这 些 图像 中 ， 坐 标 人 @ 刀 处 的 值 是 了 内 具有 灰 度 = A z, 的 像素 对 在 由 O 指定 的 位 置 处 出 现 


区 i} 


的 次 数 ， 因 此 图 11.31 (a) 是 一 幅 随机 图 像 并 不 奇怪 。 





图 11.30 其 像素 具有 (a) 随机 模式 、(b) 周期 模式 和 (c) 混合 纹 
理 模 式 的 图 像 。 每 幅 图 像 的 大 小 都 为 263x800 像素 





图 11.31 大 小 为 256x256 的 共生 和 矩阵 Gi, G2, G;， 从 左 到 右 对 应 于 图 11.30 中 的 图 像 
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图 11.31(b) 更 有 趣 。 第 一 个 明显 的 特征 是 关于 主 对 角 线 对 称 。 由 于 正弦 波 的 对 称 性 ， 像 素 对 ( = , z, ) 的 
计数 与 像素 对 ( z,, 2, ) 的 计数 相同 ， 从 而 产生 了 一 个 对 称 的 共生 和 矩阵 。 G, 的 非 零 元 素 是 稀疏 的 ， 因为 水 平 
正弦 波 中 水 平 相 邻 像素 间 的 差 值 相对 较 小 。 数 字 化 后 的 正弦 波 是 阶梯 状 的 ， 每 个 阶梯 的 高 度 和 宽度 取决 于 
表示 函数 中 使 用 的 频率 和 幅度 级 数 ， 这 些 有 助 于 解释 这 些 概念 。 

图 11.31 (c) 中 共生 矩阵 G 的 结构 更 复杂 。 沿 主 对 角 线 也 聚集 了 高 计数 值 ， 但 它们 的 分 布 与 G, 相 比 更 
密集 ， 这 一 特征 表明 图 像 的 灰 度 值 有 着 丰富 的 变化 ; 但 相 邻 像素 之 间 的 灰 度 很 少 有 较 大 的 跳 变 。 观 
察 图 11.31(c) ， 我 们 看 到 图 像 中 存在 几 个 由 较 小 灰 度 变化 表征 的 较 大 区 域 。 灰 度 的 高 跳 变 出 现在 物体 的 
边界 处 ， 但 与 整个 较 大 区 域 上 的 中 等 灰 度 跳 变 相 比 ,这些 计数 较 小 , 因此， 如 我 们 在 第 3 章 讨 论 的 那样 ， 
图 像 显示 器 同时 显示 高 值 和 低 值 的 能 力 使 得 它们 不 太 明 显 。 

前 面 的 观察 是 定性 的 。 为 定量 化 共生 和 矩阵 的 内 容 ， 我 们 需要 表 11.3 中 的 那些 描绘 子 。 表 11.4 给 出 了 
为 图 11.31 中 的 3 个 共生 和 托 阵 计算 的 这 些 描绘 子 的 值 。 注 意 ， 如 之 前 讨论 的 那样 ， 为 使 用 这 些 描绘 子 ， 共生 
和 矩阵 必须 用 它们 的 元 素 之 和 除 它 们 来 归 一 化 。 通 过 查看 图 11.30 中 的 图 像 和 图 11.31 中 对 应 的 共生 和 矩阵 ， 表 
11.4 中 的 各 项 与 我 们 期 望 的 结果 一 致 。 例 如 ， 考 虑 表 11.4 中 的 “最 大 概率 ”一 列 。 最 大 概率 对 应 于 第 三 个 共 
生 和 矩阵 ， 这 上 告诉 我 们 与 其 他 两 个 矩阵 相 比 ， 这 个 矩阵 有 最 大 数量 的 计数 (像素 对 在 图 像 内 由 @C 指定 的 位 置 处 出 
现 的 最 大 次 数 ) 。 这 与 前 面 我 们 对 G; 的 分 析 一 致 。 第 二 列 指出 最 高 相关 对 应 于 G; ， 从 而 告诉 我 们 第 二 幅 图 像 
中 的 灰 度 是 高 度 相 关 的 。 图 11.30(b) 中 反复 出 现 的 正弦 模式 揭示 了 为 什么 会 这 样 的 原因 。 TERR. G 的 相关 基本 
为 零 ， 实 际 上 这 表明 相 邻 像素 不 相关 ,这 是 随机 图 像 的 一 个 特性 ， 如 图 11.30 (a) 中 的 图 像 。 

对 比 度 描绘 子 对 于 G@I 最高， 对 于 'C, 最 低 。 从 而 我 们 看 到 ,图 像 的 随机 性 越 低 ， 甚 对比度 往往 也 越 低 。 
通过 研究 图 11.31 所 示 的 矩阵 ， 我 们 就 会 明白 其 原因 。 G- SE 1 <i j <L ACS. Mere 
何 G 都 是 相同 的 。 因 此 ， 归 一 化 共生 和 矩阵 中 元 素 的 概率 就 成 为 决定 对 比 度 值 的 因子 。 BIA G 有 最 小 的 最 
大 概率 ， 但 其 他 两 个 矩阵 有 许多 零 和 接近 零 的 概率 (图 11.31 中 的 暗色 区 域 )。 记 住 , 值 G/n 之 和 为 1， 故 
很 容易 了 解 对 比 度 描绘 子 随 着 随机 性 的 增加 而 增 大 的 原因 。 

使 用 类 似 的 方式 ， 可 以 解释 剩 下 的 三 个 描绘 子 。 一 致 性 会 随 概率 平方 值 的 增 大 而 增加 。 这 样 ， 图 像 中 
的 随机 性 越 低 ， 一 致 性 描绘 子 就 越 高 ， 如 表 11.4 中 的 第 五 列 所 示 。 同 质 性 度量 G 值 关 于 主 对 角 线 的 集中 
度 。 分母 项 (1 + |i= 办 对 所 有 三 个 共生 矩 阵 是 相同 的 ， 且 分 母 项 的 值 在 i 和 j 的 值 接近 ( 即 接 近 主 对 角 线 ) 时 
会 减 小 。 这 样 ， 靠 近 主 对 角 线 具 有 高 概率 值 (分 子 项 ) 的 矩阵 将 有 最 高 的 同 质 性 值 。 如 前 面 讨论 的 那样 ， 这 
样 一 个 矩阵 将 对 应 于 具有 “丰富 的 ” 灰 度 级 内 容 的 图 像 和 灰 度 值 较 慢 变化 的 区 域 。 表 11.4 中 第 六 列 的 各 项 
与 这 种 解释 是 一 致 的 。 

表 中 最 后 一 列 中 的 各 项 是 共生 矩阵 中 的 随机 性 测度 ,这 些 测 度 依 次 为 对 应 图 像 中 的 随机 性 测度 。 如 期 
望 的 那样 ，GI 有 最 高 的 值 ， 因 为 其 源 图 像 完 全 是 随机 的 。 其 他 两 项 的 解释 不 言 自明 。 注 意 ， 对 G, KRS 
测度 接近 理论 最 大 值 16(2log, 256=16 ). 图 11.30 (a) 中 的 图 像 由 均匀 噪声 组 成 , 所 以 每 个 灰 度 级 都 有 一 个 
近似 相等 的 出 现 概率 ， 这 是 表 11.3 PERC A — RF. 

至 此 , 我 们 已 处 理 了 每 幅 图 像 及 它们 的 共生 和 矩阵 。( 在 不 查看 图 像 的 情形 下 ) 假 设 我 们 想 要 “发 现 ” 这 些 
图 像 中 是 否 存在 任何 包含 重复 分 量 ( 即 周期 纹理 ) 的 部 分 : 完成 该 任务 的 一 种 方法 是 ， 增 大 邻 点 间 的 距离 ， 由 
这 些 图 像 导 出 共生 和 矩阵， 并 检查 共生 矩阵 序列 的 相关 描绘 子 。 如 前 面 提 及 的 那样 ， 在 处 理 共生 矩 阵 序列 时 ， 
为 减 小 矩阵 的 大 小 并 减轻 相应 的 计算 负担 ， 通 常 要 量化 灰 度 数 。 下 边 的 结果 是 使 用 二 = 8 得 到 的 。 

图 11.32 显示 了 作为 水 平 “ 偏 移 、( 即 相 邻 像素 间 的 水 平 距离 ) 从 1 (对 相 邻 像素 ) 到 SO 时 的 函数 ， 相 关 
描绘 子 的 曲线 。 图 11.32(a) 表明 所 有 的 相关 值 接近 0, 这 说 明 在 随机 图 像 中 未 找到 这 样 的 模式 。 图 11.32 (b) 
中 所 示 相 关 的 形状 清楚 地 表明 ， 输 入 图 像 在 水 平方 向 是 正 强 的 。 注 意 ， 相 关 函 数 以 一 个 高 值 开始 ， 然 后 随 
着 相 邻 像素 间 的 距离 的 增 大 而 降低 ， 再 后 重复 自身 。 
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图 11.32 ”相关 描绘 子 的 值 与 偏 移 (“ 相 邻 ”像素 间 的 距离 ) 间 的 关系 曲线 ， 图 (a) 、 
图 (b) 和 图 (c) 分 别 对 应 于 图 11.30 中 的 噪声 图 像 、 正 弦 图 像 和 电路 板 图 像 


图 11.32(c) 表 明 ， 与 电路 板 图 像 相 关联 的 相关 描绘 子 开始 时 下 降 ， 但 在 偏 移 距 离 为 16 像素 时 有 一 个 
较 强 的 峰值 -分 析 图 11. 30(c) 所 示 图 像 表明 ， a ee 11. D ， 









amie 类 似 的 观察 可 以 解释 偏 移 距 离 D 像素 处 的 更 小 峰值 。 
结构 法 


如 本 节 开 始 时 提 到 的 那样 ,第 二 类 纹理 描述 是 
基于 结构 概念 的 ,假设 我 们 有 一 个 形 如 Sas 的 规 
则 ,该 规则 表明 字符 5 可 被 重 写 为 a5( 例 如 ,应 用 
该 规则 三 次 会 产生 字符 串 aaas), WE a 表示 一 个 
[ 见 图 11.34(a) ]， 并且“ 向 右 侧 添加 圆 ” 的 仿 asd 
义 是 分 配 形 如 aaa… 的 一 个 字符 目 ， 那么 规则 Soe 11 33 ge RN FRAGRANCE 
aS 将 生成 如 图 11.34 (b) 所 示 的 纹理 模式 。 

C - 假设 我 们 接着 向 该 方案 中 添加 一 些 新 的 规则 : S—bA, A 

eg cA, Ac, A>bS, Sa， 其 中 5b 表示“ 下方 添加 一 个 圆 ”，c 

表示 ”向 左 侧 添加 一 个 圆 " -我 们 现在 生成 一 个 形 如 aaabccbaa 

CX OX AS 的 字符 串 ， 它 对 应 于 一 个 加 的 3x3 和 矩阵。 使 用 相同 的 方法 可 

以 生成 更 大 的 纹理 模式 ， 如 图 11.34(c) 所 示 (注意 ， 这 些 规则 
也 可 生成 非 矩形 结构 ) 。 

前 述 讨论 的 基本 思想 是 ， 一 个 简单 的 “纹理 基 元 ”可 借 
助 一 些 规 则 用 于 形成 更 复杂 的 纹理 模式 ， 这 些 规 则 限制 基 元 
(或 这 些 基 元 ) 的 可 能 排列 的 数量 。 这 些 概念 是 关系 描绘 的 核 
心 ，11.5 节 中 将 详细 讨论 这 一 主题 。 
频谱 法 

图 11.34 (a) Sc; (b) 由 规则 一 4s 如 在 5.4 节 中 讨论 的 那样 , 傅 里 叶 频 谱 非 常 适合 描述 图 

生成 的 模式 ; (c) 由 该 规则 和 像 中 的 二 维 周期 或 近似 二 维 周期 模式 的 方向 性 。 这 些 全 局 纹 

其 他 规则 生成 的 二 维 纹理 模式 理 模 式 在 频谱 中 作为 高 能 脉冲 集中 区 域 很 容易 区 分 。 这 里 ， 

a 我 们 考虑 对 纹理 描述 很 有 用 的 传 里 叶 频 谱 的 三 个 特征 : (1) 频谱 中 突出 的 尖峰 给 出 纹理 模式 的 主要 方 
向 ; (2) 频 率 平面 中 尖峰 的 位 置 给 出 模式 的 基本 空间 周期 ; (3) 采 用 滤波 方法 消除 任何 周期 成 分 而 留 
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下 非 周期 性 图 像 元 素 ， 然 后 采用 统计 技术 来 描述 。 回 忆 可 知 ， 频 谱 是 关于 原点 对 称 的 ， 所 以 只 需要 考 
虑 半 个 频率 平面 。 因 此 ,对 于 分 析 的 目的 , 每 个 周期 模式 只 涉及 频谱 中 的 一 个 尖峰 ,而 不 是 两 个 尖峰 . 

刚才 提 到 的 频谱 特征 的 检测 和 描述 通常 可 以 使 用 极 坐 标 表 达 来 简化 : 得 到 一 个 函数 S(r, 9)， 
其 中 5 是 频谱 函数 ,，r 和 0 是 该 坐标 系 中 的 变量 。 对 于 每 个 方向 Q S(r, 9) 可 以 视 为 一 个 一 维 函 数 
So(7) 。 类 似 地 ， 对 于 每 个 频率 r+，S,(9) 也 是 一 个 一 维 函 数 。 对 固定 值 9 分 析 So(r) ， 可 得 到 径 向 


上 的 频谱 特性 ( 壁 如 出 现 尖 峰 ) ; 而 对 定 值 + 分析 5S,(9)， 可 得 到 以 原点 为 圆心 的 一 个 贺 上 的 频谱 
特性 
对 这 些 函数 进行 积分 (对 离散 变量 求 和 ) ， 可 得 到 一 个 更 为 整体 的 描述 : 
S(r)= 》 5,(r) (11.3-10) 
d=0 
和 
Ry 
S(0) = > 5,(0) (11.3-11) 
r=0 


式 中 ，Ro 是 以 原点 为 圆心 的 圆 的 半径 。 

式 (11.3-10) 和 式 (11.3-11) 的 结果 为 每 对 坐标 (x, 9) 构 成 了 一 对 值 [S(7), S(0)]。 通 过 改变 这 些 坐 标 ， 我 
们 可 以 生成 两 个 一 维 函数 SOR SCO), 从 而 为 整 幅 图 像 或 所 考虑 区 域 的 纹理 构成 一 种 频谱 -能 量 描 述 。 : 
外 ,为 了 定量 它们 的 特性 ， 可 以 计算 出 这 些 函 数 本 身 的 描绘 予 。 用 于 这 一 目的 的 典型 撒 绘 子 是 
高 值 的 位 置 、 幅 度 和 轴 向 变化 的 均值 与 方差 ， 以 及 该 函数 的 均值 和 最 高 值 之 间 的 距离 。 


11.12 ， 频谱 纹理 。 

图 11.35 (a) 显示 了 随机 分 布 的 火柴 图 像 ， 图 11.35 (b) 显示 了 按 周期 排列 后 的 火柴 图 像 。 图 11.35(c) 和 
(d) 显示 了 相应 的 傅 里 叶 频 谱 。 两 个 傅 里 叶 频 谱 中 在 二 维 方向 上 延伸 的 四 边 形 周期 能 量 脉冲 ， 归 因 于 火柴 
的 其 余部 分 的 粗糙 背景 的 周期 纹理 。 图 11.35(c) 中 频谱 的 其 他 支配 成 分 是 由 图 11.35 (a) 中 物体 边缘 的 随机 
方向 引起 的 。 另 一 方面 ， 图 11.35 (d) 中 与 背景 无 关 的 主要 能 量 是 沿 水 平 轴 分 布 的 ， 它 对 应 于 图 11.35 (b) 中 


的 较 强 垂直 边缘 。 
Bae = 


ll 


图 11.35 (a) 随机 分 布 的 火柴 图 像 ;，(b) 有 序 排 列 的 火柴 图 像 ; (c) 图 (a) 的 健 里 
叶 频 谱 ; (d) FI (b) ern 频谱 。 所 有 图 像 的 大 小 均 为 600x600 像素 





图 11.36 (a) 和 (b) 是 随机 排列 火柴 的 SAHRA S(O) HAZE, 类 似 地 ,图 11.36(e) 和 (d) 是 有 序 排列 火柴 
的 SO) 曲线 和 S 6) 曲线 。 随 机 排列 火柴 的 SC 曲线 表明 没有 较 强 的 周期 分 量 [ 即 与 原点 处 的 尖峰 (直流 分 量 ) 
相 比 ， 频 谱 中 没有 其 他 支配 尖峰 ] 相反 ， 有 序 排列 火柴 的 SOHRE r= 15 附近 显示 了 一 个 较 强 的 尖峰 ， 
而 在 "= 25 附近 显示 了 一 个 较 小 的 尖峰 ， 它 们 分 别 对 应 于 图 11.35 (b) 中 亮 区 域 (火柴 ) 和 瞳 区 域 ( 背 景 ) 的 水 
平 重 复 周 期 。 类 似 地 ， 图 11.35 (c) 中 的 能 量 脉 冲 的 随机 特性 ， 在 图 11.36 (b) 所 示 的 %8) 曲 线 中 十 分 明显 。 
相 比 之 下 , 图 11.36(d) 所 示 图 形 在 靠近 原点 、90? 和 180° 的 区 域 显示 了 很 强 的 能 量 分 量 。 这 与 图 11.35 (d) 中 
频谱 的 能 量 分 布 是 一 致 的 。 
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11.3.4 PEE 
大 小 为 MXN 的 数字 图 像 fx, 习 的 二 维 w+g9g) 阶 矩 定 义 为 


M-1N-1 
Moy = >, 2 x yf (x,y) (11.2-12) 
x=0 y=0 
式 中 p=0,1,2,… 和 gq=0,1,2,… 是 整数 。 相 应 的 十 g) 阶 中 心 矩 定义 为 
M-1N-1 
a=? Z -TPO f(x, W (11.3-13) 
x=0 y=0 
式 中 p=0,1,2,.… 和 gq=0,1,2,…， 其 中 
y= 0 Ay pa (11.3-14) 
Mog Mog 
由 7 表示 的 归 一 化 中 心 矩 定义 为 
4 
pq wen (113-15) 
式 中 ， 
A A (11.3-16) 
其 中 p+g=2,3,…。 
由 二 阶 矩 和 三 阶 矩 可 推出 如 下 7 个 不 变 矩 组 "， 
Éi = o +o FEAL 
h = (Ma =) +407; (11.3-18) 


D 推导 这 些 结果 时 ， 所 用 到 的 概念 超出 了 本 书 的 讨论 范围 。 在 由 Bell[1965] 撰 写 的 图 书 和 由 Hu[1962] 发 表 的 论文 中 ， 包 含 了 这 些 
概念 的 详细 讨论 。 关 于 生成 高 于 7 阶 不 变 矩 的 方法 ， 见 Flusser[2000], AAMT HES E] n AEE (Mamistvalov[1998]) 。 
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h = (mo — 32) + Br =) (11.3-19) 

py = (ho +2) + (m1 +) (11.3-20) 

Ps = (o —372)(7730 + M2 C0 + hr Ho 3Q7721 + Mos ) ]+ (113-21) 
(3% =) Oa + Bho + 2 — (Mr +3) ] 

h = (Moy -iho + M2) — (hi + M03)? 1+ 4i (ho +12) + Mos) (11.3-22) 

h, = (372; — Mos (Aso + haih +2)” -30h +m) ]+ 
(B12 — Mos (21 + Mos 13(M50 + 2)” — Ohi + Mos)" ] 

这 些 矩 组 对 于 平移 、 尺 度 变化 、 镜 像 (内 部 为 负 号 ) 和 旋转 是 不 变 的 


(11.3-23) 


511.13 TEZE. 

本 例 的 目的 是 , 利用 图 11.37(a) 中 的 图 像 计算 并 比较 前 述 的 几 个 不 变 矩 。 黑 (0) 边界 是 加 上 去 的 ,以 使 
本 例 的 所 有 图 像 都 有 相同 的 尺寸 ; 0 不 影响 不 变 矩 的 计算 。 图 11.37(b) 到 (9 分 别 显示 了 原 图 像 经 平移 、 在 
空间 两 个 维度 上 缩小 一 半 、 镜 像 、 旋 转 45* 和 旋转 90° 操 作 后 的 结果 。 表 11.5 总 结 了 这 6 幅 图 像 的 7 个 不 
变 矩 的 值 。 为 减 小 动态 范围 进而 简化 解释 ， 所 显示 的 值 是 sgn( 办 )logio(| 和 办 |) 。 需 要 绝对 值 的 原因 是 ， 许 多 
值 是 小 数 和 /或 负数 ;符号 函数 保留 符号 (这 里 我 们 感 兴 趣 的 是 矩 的 不 变性 和 相对 符号 ， 而 不 是 它们 的 真实 
值 )。 表 11.5 中 的 两 个 关键 点 是 : (1) 矩 的 值 的 接近 程度 ， 与 平移 、 尺 度 缩放 、 镜 像 和 旋转 无 关 ; (2) 办 的 
符号 对 于 镜像 图 像 是 不 同 的 (这 是 实践 中 用 于 检测 一 幅 图 像 是 否 已 被 镜像 的 一 种 性 质 ) 。 





图 11.37 (a) 原 图 像 ，(b)~ 介 分 别 经 平移 、 缩 小 一 半 、 镜 像 、 旋 转 45o 和 旋转 90° 操 作 后 的 图 像 


表 11.5 图 11.37 中 各 幅 图 像 的 不 变 矩 



































变 原 图 像 缩小 一 半 镜 像 | 旋转 45 旋转 90 
Á 2.8662 2.8662 2.8664 2.8662 2.8661 2.8662 
h 7.1265 7.1265 7.1257 7.1265 7.1266 7.1265 
h 10.4109 10.4109 10.4047 10.4109 10.4115 10.4109 
内 10.3742 10.3742 10.3719 10.3742 10.3742 10.3742 
ds 21.3674 21.3674 21.3924 21.3674 21.3663 21.3674 
h 13.9417 13.9417 13.9383 13.9417 13.9417 13.9417 
从 -20.7809 -20.7809 -20.7724 20.7809 -20.7813 -20.7809 
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11.4 ”使 用 主 成 分 进行 描绘 


本 节 中 讨论 的 内 容 适用 于 边界 和 区 域 。 另 外 ， 这 此 内容 也 是 描绘 组 空间 上 已 配 准 图 像 的 基础 
但 这 些 已 配 准 图 像 的 对 应 像素 值 是 不 同 的 ( 即 RGB 图 像 的 三 个 分 量 图 像 ) 。 假 设 我 们 已 有 这 样 _ 幅 彩 
色 图 像 的 三 个 分 量 图 像 。 通 过 将 每 组 三 个 对 应 像素 表示 为 一 个 向 量 ， 

可 将 这 三 幅 图 像 作为 一 个 单元 来 处 理 。 例 如 ， 今 xy, m Fx 分 别 是 这 三 
幅 RGB 分 量 图 像 中 的 一 个 像素 的 值 。 这 三 个 元 素 可 以 表示 为 一 个 三 维 


列 向 量 x， 即 











这 个 向 量 表示 所 有 三 幅 图 像 中 的 一 个 共同 像素 。 如 果 图 像 大 小 为 MxN, 则 按 这 种 方式 表示 所 有 像素 后 ， 
共有 天 = MN 个 三 维 向 量 。 如 果 及 n 幅 已 配 准 的 图 像 ， 那 么 向 量 将 是 维 的 : 


x=| x (11.4-1) 


本 节 假 设 所 有 向 量 都 是 列 向 量 ( 即 nx1 阶 和 矩阵 ) = 我 们 可 将 它们 写成 一 行 ,表示 为 x= (x, 2, e x, )! 
的 形式 ， 其 中 了 表示 转 置 。 

我 们 可 以 将 向 量 当 作 随 机 量 来 处 理 ， 就 像 我 们 构建 灰 度 级 直方 图 时 所 做 的 那样 。 唯 一 的 差别 是 ， 
我 们 现在 谈论 的 是 随机 向 量 的 均值 向 量 和 方差 矩阵 ， 而 不 是 随机 变量 的 均值 和 方差 。 总 体 均值 向 量 定 
义 为 

m, = E{x} (11.4-2) 
式 中 Ef + } 是 变量 的 期 望 值 ， 下 标 表 示 m 与 向 量 x 的 总 体 相关 联 。 回 忆 可 知 ， 向 量 或 矩阵 的 期 望 值 可 
通过 取 每 个 元 素 的 期 望 值 来 得 到 。 

向 量 总 体 协 方差 矩阵 定义 为 

C, = E{(x-m,)(x-m,)"| (11.4-3) 


因为 x 是 nn 维 的 , 故 CA (x—m, )(x—m,)" FE nxn 阶 和 矩阵 。C 的 元 素 c FE x) TZ, BLEME x 向 
量 的 第 i 个 分 量 ，C. 的 元 素 cy 是 这 些 向 量 元 素 入 之 间 的 协 方差 。 和 矩阵 CG. 是 实 对 称 的 。 如 果 元 素 
x 入 是 不 相关 的 ， 则 它们 的 协 方差 为 零 ， 从 而 有 cy= ci= 0。 当 n= 1 时， 所 有 这 些 定义 都 简化 为 它 
们 所 熟悉 的 一 维 形式 。 

对 于 来 自 随机 总 体 的 8 个 向 量 取样 , 均值 向 量 可 以 通过 使 用 常见 的 求 平均 值 的 表达 式 由 样本 
来 近似 : 


K 
m, e y'a (11.4-4) 
Kin 


@ 回忆 可 知 ， 均 值 为 m 的 随机 变量 x 的 方差 定义 为 BE{G — 办 站。 两 个 随机 变量 世 和 疙 的 协 方差 定义 为 E{ i- m) Oy - m)) } 
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类 似 地 ， 通 过 展开 乘积 (x 一 m,)(x 一 m、)' 并 使 用 式 (11.4-2) 和 式 (11.4-4) ， 我 们 发 现 协 方差 矩阵 可 由 如 
下 样本 来 近似 : 


1 K 
Č, T (11.4-5) 


例 11.14 ”均值 向 量 和 协 方差 矩阵 的 计算 。 
为 说 明 式 (11.4-4) 和 式 (11.4-5) 的 机 理 ， 考 虑 4 个 向 量 x = AONDA x= OEE 和 
x, =(1,0,1)' o 和 ilk 得 到 如 下 拘 信 门生 3 











同样 ， 使 用 式 (11.4-5) 得 到 下 列 协 方差 矩阵 





沿 主 对 角 线 的 所 有 元 素 都 相等 ， 这 表明 总 体 中 向 量 的 三 个 分 上 有 相同 的 方 关 。 + BU, ae ant 
%3 是 必 定 相关 的 ， Tose Xz All X3 是 必定 不 相关 的 o i 


因为 C. 是 实 对 称 的， 所 以 总 可 以 找到 一 组 n 个 正 交 的 特征 向 量 ( 见 Noble and nn a 
e Fil . f= f 2,…,n 为 CRIE A ARIEL, 为 方便 起 见 以 降序 排列 , MEA = 4+1, j=l, 
2,° 令 4 为 一 个 矩阵 ， 其 行 由 Ce 的 特征 向 量 组 成 ， 特 征 向 量 的 排序 方式 为 4 的 第 一 行 对 应 于 
pie ice ae 最 后 一 行 对 应 于 最 小 特征 值 的 特征 向 量 。 

假设 我 们 将 4 用 做 将 向 量 x 映射 为 向 量 y 的 一 个 变换 矩阵 ， 如 下 所 示 : 


y=A(x-m,) (11.4-6) 霍 特 林 变 换 与 离散 Karhunen 
Loéve 变换 ( 见 Karhunen[1947]) 是 相 


该 表达 式 称 为 霍 特 林 变换 ， 就 像 马 上 要 说 明 的 那样 ， 该 变换 具有 一 些 | 同 的 ， 因此 文献 中 交替 使 用 这 两 个 





有 趣 且 有 用 的 性 质 。 名 称 。 
不 难 证 明 ， 由 该 变换 得 到 的 了 向 量 的 均值 为 零 ， 即 
m, = E{y}=0 (11.4-7) 
由 基本 矩阵 理论 可 知 ,的 协 方差 矩阵 由 4 和 C: 按 如 下 表达 式 给 出 : 
C= ACA (11.4-8) 
此 外 ， 因 为 构成 4 的 方式 的 原因 ，@ 是 一 个 对 角 矩 阵 ， 其 主 对 角 线 上 的 元 素 是 C. 的 特征 值 ， 即 
A 0 
C= fa d (11.4-9) 
0 A 


该 协 方差 矩阵 中 非 对 角 线 上 的 元 素 为 零 ， 所 以 向 量 y 的 元 素 是 不 相关 的 。 记 住 , Att C. 的 特征 值 ， 并 


Oz 根据 定义 ， 大 小 为 nxn 的 矩阵 C 的 特征 向 量 和 特征 值 满足 关系 Ce = hie i=1,2,…… ,no 
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且 对 角 和 矩阵 中 主 对 角 线 上 的 元 素 是 C 的 特征 值 ( 见 Noble and Daniel[1988]) 。 因 此 ，Ce 和 C, 具有 相同 
的 特征 值 。 

霍 特 林 变 换 的 另 一 个 重要 性 质 是 可 处 理由 ”重建 x 的 问题 。 因 为 4 的 各 行 是 正 交 向 量 ， 由 此 得 出 
4 = 4 " ， 且 任何 向 量 x 都 能 通过 下 式 由 其 对 应 的 y 来 恢复 : 

x=A'y+m, (11.4-10) 

然而 ， 假 设 我 们 不 使 用 Cs 的 所 有 特征 向 量 ， 而 由 对 应 于 大 个 最 大 特征 值 的 大 个 特征 向 量 来 形成 矩阵 
水 ， 那 么 将 得 到 一 个 kxn 阶 的 变换 矩阵 。 然 后 ， 向 量 了 成 为 x 维和 矩阵 ， 并且 式 (11.4-10) 给 出 的 重建 不 
再 是 精确 (这 与 我 们 在 11.2.3 节 中 使 用 少量 传 里 叶 系 数 描述 一 个 边界 的 过 程 有 些 相似 ) 。 

使 用 水 重建 的 向 量 为 


ż=A y+m, (11.4-11) 
可 以 证 明 , x Ax ZRT RE PREAH : 
n k 
ens 之 三 -之 
z rs (11.4-12) 
3 > A; 
j=k+1 


式 (11.4-12) 的 第 一 行 表 明 ， 如 果 k= n( 即 如 果 变 换 中 使 用 了 所 有 的 特征 向 量 ) ， 则 误差 为 零 。 因 为 4 
单调 递减 ， 式 (11.4-12) 还 表明 ， 通 过 选取 与 最 大 特征 值 相对 应 的 个 特征 向 量 ， 可 使 得 误差 最 小 。 从 
而 ， 从 可 以 将 向 量 x 和 其 近似 值 六 之 间 的 均 方 误差 降 至 最 小 这 方面 来 说 ， 霍 特 林 变换 是 最 佳 的 。 由 于 
使 用 对 应 于 最 大 特征 值 的 特征 向 量 这 一 思想 ， 堆 特 林 变换 也 称 为 主 成 分 变换 。 


例 11.15 使 用 主 成 分 描述 图 像 。 
图 11.38 显示 了 6 幅 多 光谱 卫星 图 像 ， 这 些 图 像 对 应 于 6 个 谱 带 ; 可 见 蓝 光 (450~520 nm) 、 可 见 绿 光 
(520-600 nm) 、 可 见 红 光 (630~690 nm) 、 近 红外 (760~900 nm) 、 中 红外 (1550~1750 nm) 和 热 红 外 (10 400~ 
12 500 nm) 。 本 例 的 目的 是 说 明 如 何 运 用 主 成 分 进行 图 像 描 述 。 





图 11.38 多 光谱 图 像 : (a) 可 见 蓝光 ; (b) 可见 绿 光 ; (c) 可 见 红 光 ; 
(d) 近 红 外 ; (e) 中 红外 ; (D 热 红外 (图 像 由 NASA 提供 ) 
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如 本 节 开 始 时 讨论 的 那样 ， 若 按 图 11.39 中 所 示 的 方式 来 组 织 图 像 ， 那 么 这 些 图 像 中 的 每 组 对 应 像素 
可 形成 一 个 6 元 素 的 向 量 x = (a, x2,…, xe)"。 本 例 中 所 有 图 像 的 大 小 都 是 564x564 像素 ， 所 以 一 共 构 成 了 
(564) = 318 096 个 向 量 , 由 此 来 计算 均值 向 量 、 协 方差 矩阵 及 相应 的 特征 值 和 特征 向 量 。 然 后 ， 特 征 向 量 
用 做 矩阵 44 的 行 ， 且 使 用 式 (11.4-6) 得 到 一 组 向量。 类似 地 ， 我 们 使 用 式 (11.4-8) 得 到 了 -Ci。 表 11.6 显 
示 了 该 矩阵 的 特征 值 。 注 意 前 两 个 特征 值 的 支配 性 。 





图 11.39 由 6 幅 图 像 中 的 对 应 像素 形成 一 个 向 量 


前 一 段 中 提 到 使 用 y 向 量 生 成 了 一 组 主 成 分 图 像 ( 反 过 来 ， 应 用 图 11.39 可 由 这 些 向 量 构建 图 像 ) 。 
图 11.40 显示 了 结果 。 图 11.40 (a) 是 由 318 096 个 向量 的 第 一 个 分 量 形成 的 , 图 11.40 (b) 是 由 这 些 向 量 的 
第 二 个 分 量 形成 的 ， 以 此 类 推 。 因 此 ,这 些 图 像 的 大 小 与 图 11.38 中 原 图 像 的 大 小 相同 。 主 成 分 图 像 中 最 
明显 的 特征 是 ， 对 比 度 细节 的 重要 部 分 包含 在 前 两 幅 图 像 中 , 并 自 此 快速 降低 。 通 过 研究 特征 值 ， 即 可 说 
明 其 原因 。 如 表 11.6 所 示 , 前 两 个 特征 值 远大 于 其 他 特征 值 。 因 为 特征 值 是 y 向 量 的 元 素 的 方差 ,而 方差 
是 灰 度 对 比 度 的 测度 ， 不 难 预 料 ， 由 对 应 于 最 大 特征 值 的 向 量 分 量 形成 的 图 像 会 显示 最 高 的 对 比 度 。 事实 


上 ， 图 11.40 中 的 前 两 幅 图 像 占 总 方差 的 89%。 其 他 4 幅 图 像 有 着 较 低 的 对 比 度 细节 ， 因 为 它们 仅 占 总 方 
差 的 11%。 
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图 11.40 使 用 式 (11.4-6) 计 算 的 向 量 得 到 的 6 幅 主 成 分 图 像 。 反 过 来 ， 应 用 图 11.39 可 由 向 量 得 到 图 像 eel 
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表 11.6 由 图 11.38 中 的 各 幅 图 像 得 到 的 协 方差 矩阵 的 特征 值 


2 2 








ab 
de 


图 11.41 仅 使 用 两 幅 主 成 分 图 像 重 建 的 多 光谱 图 像 ， 这 些 图 像 对 应 于 有 着 最 大 特征 
值 (方差 ) 的 两 幅 主 成 分 图 像 。 请 将 这 些 图 像 与 图 11.38 中 的 原 图 像 进行 比较 


根据 式 (11.4-11) 和 式 (11.4-12) , 如 果 使 用 矩阵 4 中 的 所 有 特征 向 量 , 那么 我 们 能 够 在 原始 图 像 和 重建 
图 像 间 以 0 误差 从 主 成 分 图 像 (向 量 ) 重建 原始 图 像 (向 量 ) 。 也 就 是 说 , 原 x 
图 像 和 重建 图 像 是 相同 的 。 如 果 我 们 的 目的 是 存 侍 和 /或 传输 主 成 分 图 像 | og em ee | 
及 用 于 随后 重建 原 图 像 的 变换 矩阵 ， 则 存储 和 /或 传输 所 有 的 主 成 分 图 像 | 两 者 间 存在 -一 对 应 的 关系 。 
就 没有 意义 ， 因 为 这 不 会 带 来 任何 益处 。 然 而 ， 假 设 我 们 仅 保留 和 /或 传 
输 两 幅 主 成 分 图 像 ( 它 们 拥有 多 数 对 比 度 细节 ) , 则 在 存储 和 传输 上 会 有 较 大 的 节省 (矩阵 4 的 大 小 是 2x6， 
故 其 影响 可 忽略 不 计 )。 Tn 

图 11.41 显示 了 由 对 应 于 最 大 特征 值 的 两 幅 主 成 分 图 像 来 重建 6 幅 多 光谱 图 像 的 结果 。 前 五 幅 图 像 的 
外 观 十 分 接近 于 图 11.38 中 的 原 图 像 ， 但 第 六 幅 图 像 却 不 是 这 样 。 原 因 是 原始 的 第 六 幅 图 像 实 际 上 是 模糊 
的 ,而 在 重建 中 使 用 的 主 成 分 图 像 是 清晰 的 ， 因此 丢失 了 模糊 的 “细节 ”。 图 11.42 显示 了 原 图 像 和 重建 图 
像 间 的 差 。 图 11.42 中 的 图 像 已 被 增强 ， 目 的 是 突出 它们 之 间 的 差别 。 如 果 不 对 它们 做 增强 处 理 ， 那 么 前 
五 幅 图 像 看 起 来 几乎 会 是 全 黑 的 。 如 期 望 的 那样 ， 第 六 幅 差 值 图 像 显 示 了 最 大 的 不 同 。 


例 11.16， 用 主 成 分 对 尺度 、 平 移 和 旋转 变化 归 一 化 。 

如 本 章 前 面 提 及 的 那样 ， 表 示 和 描述 应 尽 可 能 与 尺寸 、 平 移 和 旋转 无 关 。 主 成 分 针对 这 三 个 参量 的 变化 

提供 了 归 一 化 边界 和 /或 区 域 的 方便 方法 。 考虑 图 11.43 中 的 物体 。 假设 其 尺寸 、 位置 和 方向 (旋转 ) 是 任意 的 。 

区 域内 的 (或 区 域 边界 上 的 ) 点 可 视 为 二 维 向 量 x=(w,x)" ,其 中 4 和 避 SS x, ANAT x, 轴 的 任意 一 点 

的 坐标 值 。 区 域 或 边界 中 的 所 有 点 组 成 一 个 二 维 向 量 总 体 ， 如 先前 那样 ， 这 个 二 维 向 量 总 体 用 于 计算 协 方 

差 矩阵 C. 和 均值 m.。C. 的 第 一 个 特征 向 量 指向 总 体 的 最 大 方差 数据 扩散 ) 方向 ， 而 第 二 个 特征 向 量 与 第 

一 个 特征 向 量 垂直 ， 如 图 11.43 (b) 所 示 。 根 据 当前 的 讨论 ， 式 (11.4-6) 中 的 主 成 分 变换 完成 两 件 事情 : (1) 在 

870| 总 体 的 质心 (均值 ) 处 建立 变换 后 的 坐标 系 的 中 心 ， 因 为 从 每 个 < PRET mys O) PHEN y 坐标 是 x 旋转 后 
872| ”的 形式 ， 因 此 数据 就 与 特征 向 量 联系 起 来 。 如 果 我 们 定义 一 个 Oy) 轴 系 统 ， 使 » 沿 第 一 个 特征 向 量 ， 而 









Sr 
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力 沿 第 二 个 特征 向 量 , 那么 导致 的 几何 形状 如 图 11.43 (6) 所 示 。 也 就 是 说 ， 占 支配 地 位 的 数据 的 方向 与 轴 系 统 
一 致 。 不 管 物体 的 尺度 缩放 、 平 移 或 旋转 ， 只 要 区 域 或 边界 中 的 所 有 点 都 经 历 相同 的 变化 ， 就 会 得 到 相同 的 结 
果 。 如 果 我 们 希望 在 尺度 上 归 一 化 变换 后 的 数据 ， 那 么 可 使 用 对 应 的 特征 值 来 除 该 坐标 。 


abe 
def 


图 1142 原 图 像 与 重建 图 像 之 间 的 差 。 为 便于 视觉 分 析 ， 所 有 差 
值 图 像 都 已 被 增强 ， 即 已 将 它们 标定 到 整个 范围 [0, 255] 内 
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图 11.43”(@) 一 个 物体 ; (b) 显示 其 协 方差 矩阵 的 特征 向 量 的 物体 ; (c) 使 用 式 (11.4-6) 
得 到 的 变换 后 的 物体 ; (d) 平 移 后 的 物体 ， 其 所 有 的 坐标 值 都 大 于 零 
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图 11.44 一 个 手工 例子 ; (a) 原始 点 ; (>) 图 (a) 中 各 点 的 协 方差 矩阵 的 特征 向 量 ; (c) 使 用 式 (11.4-6) 
得 到 的 变换 后 的 点 ; (qd) 来 自 图 (0) 的 点 ， 这 些 点 已 经 过 伟人 和 平移 ， 从 而 所 有 的 坐 





1.5 关系 描绘 子 


在 11.3.3 节 中 ， 为 描述 纹理 ， 我 们 介绍 了 重 写 规则 的 概念 。 在 本 节 中 ， 我 们 将 在 关系 描绘 子 的 角 
度 上 扩展 这 一 概念 。 这 些 内容 对 边界 或 区 域 同样 适用 ， 并 且 它 们 的 主要 目的 是 以 重 写 规则 的 形式 来 获 
取 边 界 或 区 域 中 的 基本 重复 模式 。 
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考虑 图 11.45 (a) 中 所 示 的 简单 阶梯 结构 。 假 设 该 结构 已 从 一 幅 图 像 中 分 割 出 来 ， 并 且 我 们 和 希望 以 
某 种 形式 化 方法 来 描述 它 。 通 过 定义 如 图 所 示 的 两 个 基 元 a 和 b, 我 们 可 以 按 图 11.45 (b) 所 示 的 形式 
对 图 11.45 (a) 进行 编码 。 编 码 后 结构 的 最 明显 性 质 是 元 素 a P b 的 重复 。 所 以 ， 一 种 简单 的 描述 方法 
是 用 公式 表示 涉及 这 些 基 元 的 递归 关系 。 一 种 可 能 性 是 使 用 重 写 规则 : 


(1) Sad 
(2) A+bS 
(3) A+b 


其 中 $ 和 4 是 变量 , 元 素 a 和 “是 对 应 于 刚才 定义 的 基 元 的 常量 。 规 则 (1) 表 明 ， 称 为 起 始 符号 的 5S 
可 以 被 基 元 a 和 变量 4 代替 。 依 次 地 ， 变 量 4 可 以 被 5 和 5S 代替 或 只 被 b 代 蔡 。 若 使 用 bS RIRE A, 
便 会 回 到 规则 (1) ， 从 而 重复 这 一 过 程 。 用 b RE 4 将 结束 这 一 过 程 ， 因 为 表达 式 中 不 再 存在 变量 。 
图 11.46 给 出 了 由 这 些 规则 导出 的 一 些 例子 ,其 中 结构 下 面 的 数字 表示 规则 1, 2 和 3 被 应 用 的 顺序 。a 
Ail b 之 间 的 关系 得 以 保留 ， 因 为 这 些 规则 迫使 一 个 a 后 总 是 跟着 一 个 bp。 值 得 注意 的 是 ， 这 三 个 简单 
的 重 写 规则 可 用 于 生成 (或 描述 ) 无 限 多 的 “相似 ”结构 。 

因为 字符 串 是 一 维 结构 ， 所 以 将 字符 串 应 用 于 图 像 描 述 时 ， 需 要 建立 一 种 适当 的 方法 来 将 二 维 
位 置 关系 简化 为 一 维 形 式 。 大 多 数 使 用 字符 串 来 描述 图 像 的 应 用 均 基 于 从 感 兴趣 物体 中 提取 连接 线 
段 的 思想 。 一 种 方法 是 追踪 一 个 物体 的 轮廓 ， 并 使 用 指定 方向 和 /或 长 度 的 线段 来 对 结果 进行 编码 。 
图 11.47 说 明了 这 一 过 程 。 


a a h ab 


起 始点 一 、 


b b 
(1, 3) z 


(1, 2,.1,:3) 





(1, 2)41,2;.1,,3) 


图 11.46 由 规则 Sa4,4 一 bs 和 4-b 导 出 的 例子 。 ”图 11.47 使 用 有 向 线段 对 一 个 区 域 边界 进行 编码 


另 一 种 更 为 通用 的 方法 是 ， 使 用 有 向 线段 来 描述 图 像 的 各 个 部 分 (如 较 小 的 单 色 区 域 ) ,除了 采用 
首尾 相连 的 方式 外 ,这 种 有 向 线段 也 可 采用 其 他 的 方式 来 连接 。 图 11.48 (a) 说 明了 这 一 方法 ,图 11.48 (b) [874 
显示 了 一 些 可 根据 抽象 的 基 元 来 定义 的 典型 操作 。 图 11.48(c) 显示 了 一 组 由 四 个 方向 定义 的 线段 组 成 | 


e 
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的 特定 基 元 。 图 11.48 (d) 显示 了 一 个 特定 形状 的 生成 步 又， 其 中 (~ 功 表 示 与 基 元 &d 方 向 相反 的 基 元 。 
注意 , 每 个 合成 的 结构 只 有 一 个 头 和 一 个 尾 。 有 意义 的 结果 是 最 后 一 个 字符 串 , 它 描述 了 完整 的 结构 。 


= 抽象 的 基 元 
fee a—b > 
抽象 的 基 元 7 
axb < 
< me 


t h t h 
| -. bs | 
h c+ (~d) d+ [c+ (~d)] 


fan 


a+b (a +b) +c {d + [c + (~d)]} + [(a + b) c] 
图 11.48 (a) 抽象 的 基 元 ; (b) 基 元 间 的 操作 ; (c) 一 组 特定 的 基 元 ; (d) 构建 一 个 结构 的 步 又 


字符 串 描述 最 适合 于 这 样 的 应 用 ， 即 应 用 中 的 基 元 连接 性 可 以 一 种 从 头 到 尾 的 方式 或 其 他 连续 方 
式 来 表示 。 有 时 ， 有 着 类 似 纹理 或 其 他 描绘 子 的 区 域 可 能 是 不 连续 的 ， 这 就 要 求 具 有 描述 这 种 情形 的 
技术 。 处 理 这 种 情况 的 有 用 方法 之 一 是 使 用 树 描绘 子 。 

一 棵 树 了 7 是 有 着 一 个 或 多 个 节点 的 有 限 集合 : ws 


(a) 仅 有 一 个 表示 根 的 节点 $。 z 
(b) 余下 的 节点 被 分 成 不 相交 的 集合 To TZ,， 每 个 集合 依次 都 = / 
是 一 棵 树 ， 称 为 了 的 子 树 。 
图 11.49 带 有 根 S 和 末梢 节 


树 的 末梢 是 树 底 端 (树叶 ) 的 节点 集合 ， 采 用 从 左 到 右 的 顺序 排列 。 例 点 xy 的 简单 树 
如 ， 图 11.49 所 示 的 树 有 根 $B 和 末梢 xy。 

一 般 来 说 ， 树 中 有 两 种 类 型 的 重要 信息 : (1) 关 于 节点 的 信息 ， 这 种 信息 是 以 描述 节点 的 一 
组 字 来 存储 的 ，(2) 一 个 节点 与 其 相 邻 节 点 相 联系 的 信息 ， 这 种 信息 是 以 指向 那些 相 邻 节点 的 一 
组 指针 来 存储 的 。 

用 于 图 像 描 述 时 ， 第 一 类 信息 识别 一 幅 图 像 子 结构 (如 区 域 或 边界 线段 ) ， 而 第 二 类 信息 定义 这 个 
子 结构 与 其 他 子 结构 间 的 物理 关系 。 例 如 ， 图 11.50 (a) 可 以 表示 为 一 棵 树 ， 方 法 是 使 用 关系 “在 ……: 
之 内 ”"。 因 此 ， 如 果树 的 根 用 $ 代 表 ， 那 么 图 11.50 (a) 表明 ， 第 一 级 复杂 性 涉及 $ 内 的 a 和 2， 这 将 产生 
从 根 发 出 的 两 个 分 支 ， 如 图 11.50 (b) 所 示 。 下 一 级 涉及 a 内 的 b 以 及 c 内 的 d 和 es。 最后, e 内 的 f 完 
成 整 棵 树 。 
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a 
E>) |1/ 


f 
图 11.50 (a) 一 个 简单 的 合成 区 域 ; (b) 使 用 关系 “在 …… 之 内 ”得 到 的 树 表示 


ab 





小 结 


从 图 像 中 分 割 出 物体 或 区 域 的 表示 和 描绘 ， 是 大 多 数 图 像 自 动 处 理 操 作 的 前 期 步骤 。 例 如 ， 这些 
描述 构成 了 下 一 章 讨论 的 目标 识别 方法 的 输入 。 正 如 本 章 涵盖 的 描绘 技术 指出 的 那样 ， 具 体 选 择 其 中 
的 哪 一 种 方法 ， 将 取决 于 所 考虑 的 问题 。 目 的 是 选择 能 够 “捕获 ”物体 或 物体 类 之 间 的 本 质 差异 的 描 
绘 子 ， 同 时 尽 可 能 保留 位 置 、 大 小 和 方向 的 独立 性 。 


参考 文献 


11.1.1 节 讨 论 的 边界 追踪 算法 由 Moore[1968] 首 次 提出 。11.1.2 节 讨 论 的 链 码 表示 由 Freeman[1961, 
1974] 首 次 提出 。 关 于 使 用 链 码 的 当前 研究 见 Bribiesca[1999] ， 他 还 将 链 码 推广 到 了 三 维 情形 
(Bribiesca[2000]) 。 计 算 最 小 周 长 多 边 形 的 详细 讨论 和 算法 (11.1.3 节 ) IL Klette and Rsenfeld[2004]， 还 可 
参见 Sloboda et al.[1998] 和 Coeurjolly and Klette[2004]。11.1.4 节 内 容 的 其 他 重要 主题 包括 不 变 多 边 形 拟 合 
(Voss and Suesse [1997])、 多 边 形 近似 算法 性 能 的 评估 方法 (Rosin[1997]) 一般 实现 (Huang and Sun[1999]) 
和 计算 速度 (Davis [1999]) 。 

关于 标记 图 ( 见 11.1.5 节 ) 的 参考 文献 是 Ballard and Brown[1982] 和 Gupta and Srinath[1988]。 寻找 上 过 和 
Wiik (IL 11.1.6 节 ) 的 基本 公式 见 Preparata and Shamos[1985], 也 可 参阅 论文 Liu-Yu and Antipolis[1993]。Katzir 
et al.[1994] 讨 论 了 部 分 闭合 曲线 的 检测 。Zimmer et al.[1997] 讨 论 了 计算 凸 壳 的 一 种 改进 算法 ，Latecki and 
Lakimper[1999] 讨 论 了 形状 分 解 的 凸 性 规则 。 

11.1.7 节 中 讨论 的 骨架 化 算法 源 于 Zhang and Suen[1984]。 关 于 该 算法 的 性 质 和 实现 的 另外 一 些 
有 用 评述 ， 见 Lu and Wang[1986]。 论 文 Jang and Chin[1990] 关 联 了 11.1.7 节 的 讨论 和 9.5.5 节 中 的 细 
化 形态 学 概念 。 对 于 存在 噪声 的 细 化 方法 ， 见 Shi and Wong[1994] 和 Chen and Yu[1996]。Shaked and 
Bruckstein[1998] 讨 论 了 一 种 可 用 于 从 骨架 中 消除 毛刺 的 修 前 算法。 中 轴 变换 的 快速 计算 见 Sahni and 
Jenq[1992] 和 Ferreira and Ubkda[1999]。 综述 性 论文 Loncaric[1998] 是 11.1 节 中 讨论 的 多 种 方法 的 重要 
参考 文献 。 

Freeman and Shapira[1975] 给 出 了 寻找 一 条 闭合 链 码 曲线 的 基本 和 拢 形 的 算法 ( 见 11.2.1 节 ) 11.2.2 节 中 关 
于 形状 数 的 讨论 基于 Bribiesca and Guzman[1980] 和 Bribiesca[1981]。 关 于 健 里 叶 描 绘 子 ( 见 11.2.3 节 ) 的 其 他 读 
物 , 见 Zahn and Roskies[1972] 和 Persoon and fu[1977], 也 可 参阅 Aguado et al.[1998] 和 Sonka et al.[1999]. Reddy 
and Chatterji[1996] 讨 论 了 使 用 FFT 算法 实现 平移 不 变 、 旋 转 不 变 和 缩放 不 变 的 一 种 重要 方法 。11.2.4 节 中 的 内 
容 是 以 基本 概率 理论 为 基础 的 (例如 ， 见 Peebles[1993] 和 Popoulis[1991]) 。 

关于 11.3.2 节 的 其 他 读物 ， 见 Rosenfeld and Kak[1982] 和 Ballard and Brown[1982]。 关 于 纹理 ( 见 11.3.3 节 ) 
优秀 介绍 ， 见 Haralick and Shapiro[1992]。 早 期 关于 纹理 的 综述 ， 见 Wechsler[1980]。Murino et al.[1998]、 
Garcia[1999], Shapiro and Stockman[2001] 是 该 领域 当前 有 代表 性 的 成 果 。 


中 
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11.3.4 节 中 讨论 的 矩 不 变 方法 源 自 Hu[1962]， 也 可 参阅 Bell[1965]。 要 了 解 矩 不 变 的 应 用 范围 ， 可 参阅 
Hall[1979] 中 关于 图 像 匹配 的 论述 及 Cheung and Teoh[1999] 中 关于 使 用 和 矩 来 描述 对 称 性 的 论述 。 
Mamistvalov[1998] 将 矩 不 变 方法 推广 到 了 zz 维 情形 。 对 于 任意 阶 矩 的 生成 ， 见 Flusser[2000]。 

Hotelling[1933] 首 次 推导 了 将 离散 变量 转换 成 不 相关 系数 的 方法 ,这 种 技术 称 为 主 成 分 方法 ,Kramer and 
Mathews[1956] 和 Huang and Schultheiss[1963] 再 次 发 现 了 霍 特 林 变换 。 主 成 分 仍 是 多 数 应 用 中 描述 图 像 的 基 
本 工具 , PÉI Swets and Weng[1996] 和 Duda, Heart and Stork[2001]。11.5 节 的 参考 文献 来 自 Gonzalez, — 
Thomason[1978] 和 Fu[1982] ,也 可 参阅 Sonda et al.[1999], 本 章 中 关于 实现 的 附加 读物 见 NixonandAguado[2002] 
和 Gonzlez, Woods and Eddins。 


习题 


11.1 x(a) 重新 定义 链 码 的 一 个 起 始点 , 以 便 所 得 的 数字 序列 形成 一 个 最 小 值 整数 。 请 证 明 该 编码 与 边 
界 上 的 初始 起 点 无 关 。 
(b) 求 编 码 10176722335422 的 归 一 化 起 始点 。 
11.2 (a) 如 11.1.2 节 中 解释 的 那样 ， 证 明 链 码 的 一 次 差分 会 将 该 链 码 关于 旋转 归 一 化 。 
(b) 计算 编码 0110233210332322111 的 一 次 差分 。 
11.3 x (a) 证 明 11.1.3 节 中 讨论 的 橡皮 模 多 边 形 近 似 方法 会 生成 一 个 最 小 周 长 多 边 形 。 
(b) 证 明 : 若 每 个 单元 对 应 边界 的 一 个 像素 ， 则 该 单元 中 的 最 大 可 能 误差 为 4/V2 ， 其 中 
d 是 相 邻 像素 之 间 的 最 小 水 平 距 离 或 垂直 距离 (用 于 生成 数字 图 像 的 取样 网 格 中 线 间 
的 距离 ) 。 
11.4 在 如 下 条 件 下 ， 解释 11.1.3 节 中 的 MPP 算法 是 如 何 工 作 的 : 
k (a) 1 像素 宽 、1 像素 深 的 锯齿 。 
k (b) 1 像素 宽 、2 或 多 像素 深 的 锯齿 。 
(c) 1 像素 宽 、1 像素 长 的 凸 起 。 
(d) 1 像素 宽 、n 像素 长 的 凸 起 。 
11.5 x(a) 如 果 在 11.1.4 节 讨 论 的 聚合 方法 中 将 误差 阐 值 设 为 0， 请 讨论 对 所 得 多 边 形 的 影响 。 
(b) 如 果 在 分 裂 方法 中 这 样 做 ， 有 何 影响 ? 
11.6 x(a) 使 用 11.1.5 节 讨 论 的 正切 角 方法 ， 画 出 一 个 方形 边界 的 标记 图 。 
(b) 使 用 斜率 密度 函数 ， 重 复 上 一 问题 。 
假设 该 方形 分 别 与 x 轴 和 yy 轴 对 准 ， 且 x 轴 为 参考 线 。 从 最 靠近 原点 的 角 开 始 。 
11.7 求 下 列 每 一 边界 的 标记 图 的 表达 式 ， 并 画 出 标记 图 。 
* (a) 一 个 等 边 三 角形 。 
(b) 一 个 正方 形 。 
(c) 一 个 椭圆 。 
11.8 画 出 下 列 图 形 的 中 轴 : 
* (a) 一 个 圆 。 
x (b) 一 个 等 边 五 边 形 。 
(c) 一 个 和 矩形。 
(d) 一 个 等 边 三 角形 。 
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11.9 ”对 于 如 下 所 示 的 每 个 图 形 : 
x (a) 讨论 在 点 pp 执行 11.1.7 节 中 介绍 的 骨架 化 算法 的 步 又 1 时 ， 所 产生 的 作用 。 
(b) 重复 该 算法 的 步骤 2。 假设 所 有 情形 下 p= 0。 





11.10 参考 11.1.7 节 中 介绍 的 骨架 化 算法 。 请 问 在 执行 如 下 操作 后 所 示 图 形 是 什么 样子 ? 
k (a) 执行 完 一 遍 该 算法 的 步骤 1。 
(b) 执行 完 一 遍 该 算法 的 步骤 2 (在 步骤 1 的 结果 上 而 非 原 图 
像 上 执行 ) 。 


Sts @ & & wee? 2} ww 而 站 外 


11 & (a) 下 图 中 的 形状 数 的 顺序 是 什么 ? TT 
(b) 求 形状 数 。 
11.12 1123 节 中 讨论 的 使 用 傅 里 叶 描 绘 子 的 过 程 如 下 : 将 一 个 轮廓 的 坐标 表示 为 复数 ， 求 这 些 复数 的 DFT. 


并 只 保留 DFT 的 一 些 成 分 来 作为 该 边界 形状 的 描绘 子 。 求 取 反 DFT 即 可 得 到 原始 轮廓 的 近似 。 请 


问 哪 类 轮廓 形状 具有 由 实数 构成 的 DFT? 必须 怎样 设置 图 11.19 中 的 轴 系 统 ， 才 能 得 到 这 些 实数 ? 
11.13 证明; 若 在 式 (11.2-5) 中 仅 用 两 个 健 里 叶 描 绘 子 (u= 0 M u = 1) 来 重建 一 条 边界 ， 则 结果 总 是 一 个 
圆 。( 提 示 : 在 复 平面 中 使 用 圆 的 参数 表示 ， 并 在 极 坐标 中 表示 圆 的 方程 。) 
太 11.14 ”给 出 区 分 图 11.10 中 所 示 图 形 符号 所 需 的 统计 和 矩 描 绘 子 的 最 小 数量 。 
1.15 ”给 出 具有 相同 均值 和 三 阶 统计 矩 描绘 子 但 具有 不 同 二 阶 矩 的 两 个 边界 形状 。 
太 11.16 ”提出 一 组 能 区 分 字符 0, 1, 8, 6 和 Z 的 形状 的 描绘 子 。 (提示 : 联合 使 用 拓扑 描绘 子 和 凸 壳 ) 。 
11.17 ”考虑 一 幅 大 小 为 100x100 像素 的 二 值 图 像 ,图 像 中 有 一 条 从 第 1 列 延 伸 到 第 99 列 的 垂直 黑色 条 带 ， 
及 从 第 50 列 延 伸 到 第 100 列 的 垂直 白色 条 带 。 
(a) 使 用 位 置 算 子 “ 右 侧 一 个 像素 ” 求 该 图 像 的 共生 和 矩阵 。 
友 (b) 如 在 11.3.1 节 中 解释 的 那样 ， 归 一 化 该 矩阵 ， 以 使 其 元 素 成 为 概率 估计 。 
(c) 使 用 来 自 (b) 的 矩阵 计算 表 11.3 中 的 6 个 描绘 子 。 


11.18 考虑 一 幅 其 中 交替 出 现 黑色 和 白色 方块 的 棋盘 图 像 ， 每 个 方块 的 大 小 为 mxm。 给 出 可 以 生成 一 个 


对 角 共 生 和 矩阵 的 位 置 算 子 。 
11.19 ”在 如 下 条 件 下 ,， 求 一 幅 其 中 交替 出 现 1 和 0 且 大 小 为 8x8 的 棋盘 图 像 的 灰 度 级 共生 矩阵 : 
x (a) 位 置 算 子 O 定义 为 “ 右 侧 一 个 像素 ”。 
(b) 位 置 算 子 0 定义 为 “ 右 侧 两 个 像素 ”。 
假设 左上 角 像 素 的 值 为 0。 
11.20 证明 式 (11.4-7) 、 式 (11.4-8) 和 式 (11.4-9) 的 正确 性 。 


六 11.21 例 11.13 中 曾 提 到 , 仅 用 与 最 大 特征 值 相 联系 的 两 个 主 成 分 图 像 , 就 可 重建 6 幅 原 图 像 的 近似 是 较 


为 可 靠 的 做 法 。 这 样 做 对 均 方 误差 有 何 影响 ? 请 将 你 的 答案 表示 为 最 大 可 能 误差 的 百分比 。 
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11.22 


* 11.23 
11.24 


x 11.25 


11.26 


11.27 
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对 于 一 组 大 小 为 32x32 的 图 像 , 假设 式 (11.4-9) 给 出 的 协 方差 矩阵 证 明 是 单位 矩阵 。 原 图 像 和 仅 使 
用 一 半 的 原始 特征 向 量 由 式 (11.4-11) 重建 的 图 像 间 的 均 方 误差 将 是 什么 ? 

请 问 在 什么 条 件 下 ， 你 会 期 望 11.2.1 节 中 定义 的 边界 主轴 等 于 该 边界 的 本 征 轴 ? 

给 出 黑白 方块 棋盘 图 案 的 空间 关系 和 对 应 的 树 形 表达 。 假 设 左上 和 角 元 素 为 黑色 ， 并 且 树 根 对 应 于 
该 元 素 。 要 求 从 所 构造 树 的 每 个 节点 引出 的 分 支 不 超过 两 个 。 

假设 一 家 公司 与 你 签订 了 设计 一 个 图 像 处 理 系统 的 合同 。 图 像 处 理 系统 用 于 检测 某 些 实心 塑料 圆 
片 内 部 的 缺陷 。 圆 片 使 用 一 台 X 射线 成 像 系 统 检测 ， 所 生成 的 8 比特 图 像 的 大 小 为 1024x1024。 
不 存在 缺陷 时 ,图像 呈现 的 是 平均 灰 度 为 100、 方差 为 200 的 均匀 图 像 。 存 在 缺陷 时 ,缺陷 在 图 像 
中 表现 为 斑点 状 区 域 , 这 些 区 域 中 约 有 70% 的 像素 的 灰 度 偏离 40 这 一 灰 度 级 , 或 者 均值 小 于 100. 
如 果 这 样 一 个 区 域 的 面积 超过 了 20x20 像素 ， 则 认为 此 圆 片 有 缺陷 。 请 提出 一 个 基于 纹理 分 析 的 
系统 。 

一 家 使 用 瓶子 盛装 各 种 工业 化 学 品 的 公司 ， 在 听 说 你 成 功 地 解决 了 图 像 处 理 问 题 后 ， 雇 用 你 来 设 
计 一 种 检测 瓶子 未 装 满 的 方法 。 瓶 子 在 传送 带 上 移动 并 通过 自动 装填 和 封 盖 机 时 的 情形 如 下 图 所 
示 。 当 液 位 低 于 瓶颈 底部 和 瓶子 肩 部 的 中 间 点 时 ， 则 认为 瓶子 未 装 满 。 瓶 子 横断 面 的 侧面 与 倾斜 
面 的 区 域 定义 为 瓶子 的 肩 部 。 瓶 子 在 不 断 移 动 ， 但 该 公司 有 一 个 成 像 系 统 ， 该 系统 装备 了 一 个 前 
端 照 明 闪 光 灯 ， 可 有 效 地 停止 瓶子 的 移动 ， 所 以 你 可 以 得 到 非常 接近 于 这 里 显示 的 样 例 图 像 。 基 
于 上 述 资料 ， 请 你 提出 一 个 检测 未 完全 装 满 的 瓶子 的 解决 方案 。 清 楚 地 陈述 你 所 做 的 那些 可 能 会 
影响 到 解决 方案 的 所 有 假设 。 





听 说 你 成 功 地 解决 了 装 瓶 问题 后 ， 一 家 流体 公司 与 你 联系 ， 硕 望 能 以 某 些 处 理解 决 气泡 自动 计数 
工作 ， 以 便 进 行 质 量 控制 。 该 公司 已 解决 了 成 像 问题 ， 并 可 以 得 到 分 辨 率 为 800x800 像素 的 8 HE 
特 图 像 ， 如 下 图 所 示 。 每 幅 图 像 表 示 大 小 为 8 cm 的 面积 。 公 司 希 望 使 用 每 幅 图 像 来 做 两 件 事情 : 
(1) 确定 图 像 中 气泡 所 占 面积 与 图 像 总 面积 的 比率 ，(2) 计算 不 同 气泡 的 数量 。 基 于 上 述 资料 ， 请 
你 提出 该 问题 的 一 个 解决 方案 。 在 你 的 解决 方案 中 ， 必 须 指出 可 检测 到 的 最 小 气泡 的 物理 尺寸 。 
清楚 地 陈述 你 所 做 的 那些 可 能 会 影响 到 解决 方案 的 所 有 假设 。 









be considered to be made up of patterns. 
essentially an arrangement. It is characterized by 
order of the elements of which it is made, rather than 
by the intrinsic nature of these elements. 


Norbert Wiener 


引言 


我 们 通过 介绍 几 种 目标 识别 技术 ， 来 结束 对 数字 图 像 处 理 的 全 部 讨论 。 正 如 1.1 节 中 所 解释 的 那 
样 ， 在 界定 数字 图 像 处 理 的 覆盖 范围 时 ， 包 含 了 图 像 中 各 个 区 域 的 识别 ， 本 章 中 称 这 些 区 域 为 目标 或 
模式 。 

本 章 中 介绍 的 模式 识别 方法 主要 分 为 两 大 领域 : 决策 理论 方法 和 结构 方法 。 第 一 类 方法 处 理 的 是 
使 用 定量 描绘 子 来 描述 的 各 种 模式 ， 如 长 度 、 面 积 和 纹理 等 。 第 二 类 方法 处 理 的 是 由 定性 描绘 子 来 描 
述 的 各 种 模式 ， 如 11.5 节 中 讨论 的 关系 描绘 子 。 

识别 的 核心 问题 是 通过 样本 模式 进行 “学 习 ” 这 一 概念 。 下 面 我 们 将 对 决策 理论 方法 和 结构 方法 
的 学 习 技术 进行 深入 讨论 。 


12.1 模式 和 模式 类 


模式 是 描绘 子 的 组 合 , 如 第 11 章 中 讨论 的 那些 描绘 子 。 在 有 关 模 式 识别 文献 中 经 常 使 用 特征 来 表 
示 描 绘 子 。 模 式 类 是 指 具 有 某 些 共同 属性 的 一 族 模式 。 模 式 类 用 mw, a, +>, ww 表示 ， 其 中 丈 是 模式 类 
数 。 由 机 器 完成 的 模式 识别 是 对 不 同 的 模式 赋予 不 同类 别 的 技术 ， 这 种 技术 是 自动 的 ， 并 且 能 尽 可 能 
地 减少 人 为 干预 。- 

实践 中 常用 的 三 种 模式 组 合 是 向 量 (用 于 定量 描述 ) 、 串 和 树 (用 于 结构 描述 ) 。 模 式 向 量 由 粗 体 小 
写字 母 表 示 ， 如 x,y 和 z， 并 采取 下 列 形式 : 


x= (123-1) 


AH, EME x aOR i 个 描绘 子 , n 是 与 该 模式 有 关 的 描绘 子 的 总 3 
数 。 模 式 向 量 以 列 向 量 ( 即 n1 阶 和 矩阵 ) 的 形式 表示 。 因 此 ， 模 式 向 量 | 请 查阅 本 书 的 网 站 。 834 
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可 以 表示 为 式 (12.1-1) 所 示 的 形式 或 用 等 价 形式 x = (x, 六 …， zx) 来 表示 ， 其 中 了 T 表 示 转 置 。 在 11.4 
节 中 ， 读 者 应 已 认识 这 种 表示 法 。 

模式 向 量 x 中 的 各 个 分 量 的 性 质 ， 取 决 于 用 来 描述 该 物理 模式 本 身 的 方法 。 下 面 我 们 使 用 一 个 简 
单 的 例子 来 加 以 说 明 。 这 个 例子 不 仅 简单 ， 而 且 给 出 了 分 类 测度 的 历史 意义 。 在 一 篇 经 典 的 论文 中 ， 
Fisher[1936] 使 用 一 种 后 来 称 为 判别 分 析 ( 将 在 12.2 节 中 讨论 ) 的 技术 ， 识 别 了 三 种 总 尾 花 (Iris setosa, 
Iris virginica Fil Iris versicolor) ， 方 法 是 测量 花瓣 的 宽度 和 长 度 ( 见 图 12.1) 。 


x2 


2.5 4 Iris virginica A & 
_ OTris versicolor a S 
4 AMW AAA A 
o Iris setosa 


花瓣 长 度 (cm) 





花瓣 宽度 (cm) 
图 12.1 由 两 个 测度 描述 的 三 种 欧 尾 花 


在 当前 术语 中 ， 每 种 花 由 两 个 测度 来 描述 ， 从 而 生成 了 形 如 


网 (12.1-2) 
X2 


的 一 个 二 维 模 式 ， 其 中 x All on DARRER KEANE, ERREF, KRA o, @ Fila, HY 3 4 
模式 类 分 别 对 应 于 setosa, virginica 和 versicolor 三 种 花 。 

由 于 花 浙 在 宽度 和 长 度 上 的 不 同 ， 描 述 这 些 花 的 模式 向 量 也 会 不 同 ， 这 种 不 同 不 仅 体现 在 不 同 的 
类 之 间 ， 也 体现 在 一 个 类 的 内 部 。 图 12.1 显示 了 每 种 营 尾 属 花 的 几 个 样本 的 长 度 和 宽度 测度 。 在 选 定 
了 一 组 测度 后 (本 例子 中 为 两 个 测度 ) ， 模 式 向 量 的 分 量 便 成 为 每 个 物理 样本 的 完整 描述 。 因 此 ， 这 种 
情形 下 的 每 打 花 就 成 为 二 维 欧 氏 空 间 中 的 一 个 点 。 我 们 还 注意 到 ， 本 例 中 花瓣 的 长 度 和 宽度 较 好 地 分 
BT Iris setosa 与 其 他 两 种 花 , 但 Iris virginica 和 Iris versicolor 的 分 离 并 不 成 功 。 这 一 结果 说 明了 经 典 
的 特征 选择 问题 , 即 类 的 可 分 程度 很 大 程度 上 取决 于 所 用 描绘 子 的 选择 。 我们 将 在 12.2 节 和 12.3 节 详 
细 阅 述 这 一 问题 。 

图 12.2 显 示 了 模式 向 量 生成 的 另 一 个 例子 。 在 该 例 中 ,我 们 关注 的 是 不 同类 型 的 噪声 波形 ， 其 中 
一 个 样本 示 于 图 12.2 (a) 。 如 果 选 择 用 其 信号 ( 见 11.1.5 节 ) 来 表示 每 个 目标 ， 则 会 得 到 图 12.2 (b) 所 示 
形式 的 一 维 信和 号。 假设 我 们 用 其 取样 后 的 幅度 值 来 描述 每 个 信号 ; 也 就 是 说 ,我 们 以 指定 的 间隔 值 6 
pe) 对 信号 进行 取样 (表示 为 91, 8,…, On) 。 然 后 ， 我 们 通过 令 xi = A0), x2 = (0))… ,x =r(0,)， 可 构成 模 
885| SREE DEHER n 维 欧 氏 空间 中 的 点 ， 并 且 模 式 类 可 以 想象 为 n 维 空间 中 的 “ 云 团 ”。 
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替代 直接 使 用 信号 的 幅度 ， 我 们 可 以 计算 一 个 给 定 信和 号 的 前 地 个 统计 和 矩 ( 见 11.2.4 节 ) ， 并 使 用 这 


些 描绘 子 作为 每 个 模式 向 量 的 分 量 。 事 实 上 ， 生 成 模式 向 量 的 其 他 方法 还 有 许多 种 。 本 章 中 我 们 将 介 
绍 现 有 的 一 些 方法 。 目 前 ， 应 记 住 的 关键 概念 是 模式 向 量 中 每 个 分 量 的 描绘 了 的 选择 ， 描 绘 子 对 基于 
模式 向 量 方法 的 目标 识别 的 最 终 性 能 影响 巨大 。 


=m = m an 





图 12.2 hands te 的 信号 


刚才 描述 的 用 于 生成 模式 向 量 的 技术 ， 可 得 到 由 定量 信息 表征 的 模式 类 。 在 某 些 应 用 中 ,模式 特 
性 可 由 结构 关系 来 很 好 地 描述 。 例 如 ， 指 纹 识 别 基于 痕迹 特性 的 相互 关系 ， 这 种 相互 关系 称 为 细节 。 
与 它们 的 相对 尺寸 和 位 置 一 起 ， 这 些 特 性 是 描述 指纹 准 线 特性 的 主要 分 量 ， 如 指纹 的 断 点 、 分 支 、 合 
并 和 不 连续 线段 。 这 类 识别 问题 使 用 结构 方法 通常 能 得 到 解决 , 因为 这 种 问题 不 仅 定量 度量 每 种 特性 ， 
而 且 这 些 特 性 间 的 空间 关系 决定 了 类 别 的 成 员 。11.5 节 中 已 介绍 过 这 一 主题 。 这 里 ， 我 们 从 模式 描绘 
子 的 意义 上 ， 再 次 对 其 进行 简单 介绍 。 

图 12.3 (a) 显示 了 一 个 简单 的 阶梯 模式 。 采 用 类 似 于 图 12.2 中 使 用 的 方法 ， 该 模式 可 被 取样 并 表 
示 为 一 个 模式 向 量 。 然 而 ， 如 果 采 用 这 种 描述 方法 ,- 那么 由 两 个 简单 的 主要 元 素 重 复 组 成 的 基本 结构 
将 会 丢失 。 一 种 更 有 意义 的 描述 方法 是 定义 元 素 a 和 b， 并 将 该 模式 定义 为 如 图 12.3 (b) 所 示 的 串 
w =…abababab… 。 在 这 种 描述 中 ， 该 特殊 模式 类 的 结构 是 按 如 下 方式 得 到 的 : 以 首尾 相连 的 方式 定 
义 连接 性 ， 且 只 允许 符号 交 蔡 。 这 种 结构 组 成 适用 于 任何 长 度 的 阶梯 ， ered meee? 的 其他 
组 合生 成 其 他 类 型 的 结果 。 





ab... Be in A 
|p |, 
| 
f 
图 12.3 (a) 阶梯 结构 ; (b) EHEJ a 和 4 对 结 图 12.4 ”建筑 物 密集 的 城市 中 心 区 ( 华 
构 编码 ， 生 成 串 描述 … ababab 盛 顿 特区 ) 和 周围 居民 区 的 卫 
串 描述 适 于 生成 其 结构 是 基于 基 元 的 简单 连接 ， 并 且 通 常 是 EL 


和 边界 形状 有 关系 的 目标 模式 和 其 他 实体 模式 。 对 许多 应 用 来 说 , 一 种 更 有 效 的 方法 是 使 用 树 形 描述 ， 
如 11.5 节 中 定义 的 那样 。 基 本 上 ， 多数 层次 排序 方案 都 会 导致 树 结构 。 例如， 图 12.4 显示 了 建筑 物 密集 
的 市 区 和 周围 居民 区 的 一 幅 卫 星 图 像 。 我 们 使 用 符号 $ 来 定义 整个 图 像 区 域 。 图 12.5 中 (从 上 到 下 ) 显示 
的 树 形 表示 是 通过 使 用 结构 关系 “由 …… 组 成 ”得 到 的 。 因 此 ， 树 的 根 表示 整 幅 图 像 。 下 一 层 表示 该 图 像 
由 市 区 和 居民 区 构成 。 居 民 区 依次 由 住宅 、 高 速 公路 和 购物 中 心 构成 。 再 下 一 层 描 述 住宅 和 高 速 公路 。 我 
们 可 以 继续 按 这 样 的 方式 细 分 ， 直 到 达到 我 们 在 图 像 上 解析 不 同 区域 的 能 力 的 极限 为 止 。 


887 
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图 像 
saa Been $ is N 
市 区 居民 区 
建筑 物 高 速 公 路 房屋 购物 中 心 高 速 公路 
大 结构 多 条 许多 十 字 路 口 环 路 低 密 度 。 小 结构 。 森林 区 单条 Ro FRI 


图 12.5 图 12.4 中 图 像 的 树 形 描述 
在 接 下 来 的 几 节 中 ， 我 们 将 探讨 使 用 前 几 段 中 讨论 过 的 技术 描述 的 目标 识别 方法 。 


12.2 ”基于 决策 理论 方法 的 识别 


决策 理论 方法 识别 以 使 用 决策 (或 判别 ) 函数 为 基础 。 如 12.1 节 中 讨论 的 那样 , 令 x= Co zx 
表示 一 个 n 维 模式 向 量 。 对 于 到 个 模式 类 @, cp,…, ww， 决 策 理论 模式 识别 的 基本 问题 是 依据 如 下 属 
性 来 找到 万 个 决策 函数 d(x), dx), ,dmx): 如 果 模 式 x 属 于 类 必 ， 则 
d(x)>d(x)  j=,2y,Wsj#i (12.2-1) 
换 句 话说 ,将 x 代入 所 有 决策 函数 后 ， 如 果 dx) 得 到 最 大 值 ， 则 称 未 知 模式 x 属于 第 i 个 模式 类 。 该 
关系 可 以 任意 求解 。 
从 类 中 分 离 出 类 @ 的 决策 边界 ， 由 满足 d(x) = d(x) 的 x 值 给 出 ,或 等 价 地 由 
d,(x)-d,(x) =0 (12.2-2) 
的 x 值 给 出 。 
通常 的 做 法 是 ， 使 用 单一 函数 dj(x) = dix) 一 d(x) = 0 来 识别 两 类 之 间 的 决策 边界 。 因 此 ， 对 于 模 
式 类 必 有 do >0， 而 对 于 模式 类 必 有 de) <0。 本 节 的 主要 目的 是 探讨 寻找 满足 式 (12.2-1) 的 决策 区 
数 的 各 种 方法 。 


12.2.1 匹配 


基于 匹配 的 识别 技术 通过 一 个 原型 模式 向 量 来 表示 每 个 类 。 根 据 一 种 预先 定义 的 测度 ， 将 一 个 未 
知 模式 赋予 最 接近 的 类 。 最 简单 的 方法 是 最 小 距离 分 类 器 ， 如 其 名 称 所 示 ， 最 小 距离 分 类 器 计算 该 未 
知 模式 与 每 个 原型 向 量 间 的 ( 欧 氏 ) 距离 。 它 选择 最 小 距离 来 决策 , 我 们 还 将 探讨 一 种 基于 相关 的 方法 ， 
该 方法 可 根据 图 像 用 公式 来 直接 表达 ， 因 此 相当 直观 。 


最 小 距离 分 类 器 
假设 我 们 把 每 个 模式 类 的 原型 定义 为 该 类 模式 的 平均 向 量 : 


m= Da j=1,2,.,W (12.2-3) 
AH, 忌 是 来 自 必 类 模式 向 量 的 数量 ， 求 和 操作 对 所 有 这 些 向 量 执行 。 如 以 前 那样 ， 丈 是 模式 类 的 数 
量 。 如 前 所 述 ， 求 未 知 模式 向 量 x 的 类 成 员 的 一 种 方法 是 ， 将 它 赋 给 其 最 接近 的 原型 类 。 使 用 欧 氏 距 
离 求 接近 程度 可 将 该 问题 简化 为 计算 如 下 距离 测度 : 


D,(x)=|x-m,| j=b2…,W (12.2-4) 
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steht, Jaj (a'a) 是 欧 几 里 得 范 数 。 然 后 ， 若 Do 是 最 小 距离 ， 则 把 x 赋 给 类 ww。 也 就 是 说 ， 最 小 
距离 意味 着 该 式 表示 最 好 的 匹配 。 不 难 证 明 (见习 题 12.2) ， 选 择 最 小 距离 等 同 于 计算 函数 

d, (x) =x!'m, -5mm j=1,2,.…,W (12.2-5) 
并 在 d(x) 获 得 最 大 数值 时 ， 将 x 划 归 类 wy。 该 式 与 式 (12.2-1) 中 定义 的 决策 函数 的 概念 一 致 。 

由 式 (12.2-2) 和 式 (12.2-5) ， 对 于 一 个 最 小 距离 分 类 避 ， 类 ow 和 类 之 间 的 决策 边界 为 
d;(x)= di(x)—d;(x) 
n 1 (12.2-6) 
=x Cat =) 5 a (m,+m,)=0 

由 式 (12.2-6) 给 出 的 决策 面 是 连接 m Al mj 的 线段 的 垂直 等 分 线 ( 见 习题 12.3) 。n=2 时 ,垂直 等 分 线 是 一 
条 直线 ; n=3 时 ， 它 是 一 个 平面 ; n>3 时 ， 称 其 为 一 个 超 平面 。 


12.1 最 小 距离 分 类 器 的 说 阴 。 

图 12.6 显 示 了 从 图 12.1 的 芒 尾 属 植物 例子 中 提取 的 两 个 模式 类 ,两 个 模式 类 ris versicolor il Iris setosa 
分 别 表示 为 @ 和 四， 其 样本 均值 向 量 为 m = (4.3, 1.3)" M m = (1.5, 0.3)7。 由 式 (12.2-5) 可 知 ， 决 策 函 数 为 

d,(x)=x'm, 二 mm = 4.3x, +1.3x, —10.1 
和 
7 at ik +0.3x, -1.17 ` 

由 式 (12.2-6) "A ， 边 界 方程 为 
| yx) = dy(x) — d(x) = 2.84 + 1 -0x.—8.9=0. 
图 12.6 显示 了 该 边界 的 图 形 ( 注 意 ， 轴 的 比例 不 同 ) 。 代 入 来 自 类 mw 的 任何 模式 向 量 , Se 


相反 ,代入 来 自 类 的 任何 模式 向 量 ， 都 会 得 到 dole) <0。 换 句 话说 ， i EE A 
BX, droit E E E ARAMA o 


o Iris versicolor 
o Iris setosa 


20 | F 28x; + 1.0x, — 8.9 = 0 





口 


oo O 
Bee 


日 ED 
口 





TER 5K BE (cm) 


k 4 
花 斩 长度 (cm) 
图 12.6 26 Iris versicolor 和 类 Iris setosa 的 最 小 距离 分 类 器 的 决策 边界 。 黑 点 和 方块 是 均值 
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实际 上 ， 就 每 个 类 的 均值 而 言 ， 当 均值 间 的 距离 与 每 个 类 的 分 散 度 或 随机 性 相 比较 大 时 ， 最 小 距 
离 分 类 器 工作 得 很 好 。 在 12.2.2 节 中 ,我们 将 证 明 : 当 每 个 类 关于 其 均值 的 分 布 在 n 维 模 式 空间 中 表 
现 为 一 种 球形 的 “ 超 云 团 ” 形 式 时 ， 最 小 距离 分 类 器 (在 最 小 化 错误 分 类 的 平均 损失 方面 ) 会 产生 最 佳 








性 能 。 ae 
实际 中 ， 很 少 同时 出 现 较 大 的 均值 分 离 和 。 有 二 























相对 较 小 的 散布 ， 除 非 系统 设计 人 员 能 控制 给 。 Se 
入 的 性 质 。 一 个 很 好 的 例子 就 是 设计 用 于 读 取 针 
固定 格式 字符 的 系统 ， 如 我 们 熟知 的 美国 银行 
家 协会 的 E-13B 字 型 的 字符 集 。 如 图 12.7 所 
示 ， 这 个 特殊 字体 的 字符 集 由 14 个 字符 组 成 ， 
为 便于 读 取 , 这 些 字符 被 特意 设计 在 大 小 为 9x7 
的 网 格 中 。 这 些 字符 通常 使 用 含有 很 细 的 磁性 
材料 的 油墨 来 印刷 。 读 取 这 些 字符 之 前 ， 对 油 
墨 施 加 了 一 个 磁场 来 加 重 每 个 字符 ， 以 便 简 化 
检测 。 换 句 话说 ， 通 过 人 为 地 突出 每 个 字符 的 
关键 特征 ， 解 决 了 分 割 问题 。 

通常 使 用 单 缝 读 取 头 来 水 平 扫 描 字 符 , 读 取 
头 与 字符 相 比 要 罕 一 些 、 长 一 些 。 当 读 到头 横 向 
移 过 一 个 字符 时 ,会 产生 一 个 一 维 电 信和 叶 (一 个 信 
号 ) ,该 电信 号 与 读 取 头 下 方 字符 面积 的 增 大 率 或 coo 
减 小 率 成 正比 。 例 如 ， 考 虑 与 图 12.7 中 数字 0 相 EB HTT 
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关联 的 波形 。 读 取 头 从 左 向 右 移 动 时 ， 读 取 头 看 























到 的 字符 面积 开始 增 大 , 产生 一 个 正 导 数 ( 一 个 正 Rae 
变化 率 ) , 读 取 头 开始 远离 0 的 左 半 部 时 , 读 取 头 12.7 美国 银行 家 协会 E-138 字符 集 和 对 应 的 波形 
下 方 的 字符 面积 开始 减少 ， 产 生 一 个 负 导 数 。 读 取 头 位 于 该 字符 的 中 间 区 域 时 ， 字 符 面积 几乎 保持 不 变 ， 
产生 一 个 零 导 数 。 读 取 头 进入 字符 的 右 半 部 分 时 ， 这 种 模式 自身 重复 一 次 。 这 种 字体 设计 确保 了 各 个 字符 
的 波形 是 完全 不 同 的 ， 同 时 也 确保 了 每 个 波形 的 峰值 和 零 值 大 致 出 现在 背景 网 格 的 垂直 线 上 ， 如 图 12.7 
所 示 。E-13B 字符 具有 这 样 一 个 性 质 ， 即 仅 在 这 些 点 处 对 波形 取样 就 可 产生 进行 正确 分 类 的 足够 信息 。 
磁性 油墨 的 使 用 有 助 于 提供 干净 的 波形 ， 从 而 使 分 散 性 最 小 。 

针对 这 一 应 用 设计 一 个 最 小 距离 分 类 器 相当 简单 。 我 们 只 需 存储 每 个 波形 的 样本 值 ， 然 后 将 每 组 
样本 表示 为 一 个 原型 向 量 mw = 1 2,…,14。 当 对 一 个 未 知 字 符 进行 分 类 时 ， 方法 是 使 用 刚才 描述 的 方 
式 扫描 它 ， 将 波形 的 网 格 样 本 表示 为 一 个 向 量 x， 然 后 依据 式 (12.2-5) 得 到 的 最 高 值 选 择 原 型 向 量 的 类 
别 。 该 类 别 即 为 该 原型 向 量 所 属 的 类 别 。 使 用 由 一 组 电阻 器 组 成 的 模 


> y 当 函 数 不 同 时 ， 我 们 应 将 相关 正 
5 hi > 

拟 电路 可 实现 高 速 分 类 (见习 题 12.4) 。 了 

相关 匹配 则 应 将 相关 称 为 自 相关 。 但 是 ， 当 


一 个 给 定 应 用 中 两 个 函数 相同 或 不 
在 3.4.2 节 中 ,我 们 介绍 了 空间 相关 的 基本 概念 ， 并 且 在 该 节 将 它 | 同 很 明确 时 ， 通 常 使 用 相关 这 一 通 





广泛 地 用 于 空间 滤波 。 在 4.6.7 节 和 表 43 P, 我们 也 简要 地 提 到 了 相 【下 


关 定 理 。 由 式 (3.4-1) 可 知 ， 大 小 为 mxn 的 模板 w(x,y) 与 图 像 f(x, y) 的 相关 可 表示 为 





c(x,y) = Yds, f(x+s,y+0) (12.2-7a) 
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其 中 ， 求 和 的 上 下 限 取 w 和 /的 共同 范围 。 对 变量 x 和 y 的 所 有 偏 移 值 计算 该 式 ， 以 便 w 的 所 有 元 素 
访问 /的 每 个 像素 ， 这 里 假设 /大 于 w。 就 像 空间 卷 积 通过 卷 积 定理 与 函数 的 傅 里 叶 变换 相 联 系 那样 ， 
空间 相关 通过 相关 定理 与 函数 的 变换 相 联系 : 

f(x,y) w(x, y) & F*(u,v)W (u,v) (12.2-7b) 


AP, ERZA, F* 是 FEH., K 4.3 中 说 明 的 相关 定理 的 另 一 半 对 当前 讨论 而 言 并 不 
重要 。 式 (12.2-7b) 是 传 里 叶 变 换 对 ， 除 了 我 们 使 用 函数 的 一 个 复 共 生 之 外 ， 其 解释 与 式 (4.6-24) 是 一 样 
的 。 式 (12.2-7b) 的 傅 里 叶 反 变换 得 到 一 个 类 似 于 式 (4.6-23) 的 二 维 循环 相关 ， 并 且 4.6.6 节 中 讨论 的 卷 
积 填充 问题 同样 适用 于 相关 。 
我 们 并 不 打算 详 述 前 述 公 式 ， 因 为 它们 对 f 和 w 的 尺度 变化 很 敏感 。 作 为 奉 代 ， 我 们 使 用 如 下 的 
归 一 化 相关 系数 : 
D> [ws,d) -w/ts,y+d)—, | 


y(x, y) EER T EE T A ATE (12.2-8) 
[E Emen- EEs- 


其 中 , 求 和 的 上 下 限 取 w 和 .的 共同 范围 ，w 是 模板 的 平均 值 (只 计算 一 次 ) pÆ PS w 重合 区 
域 的 平均 值 。 通常， 我 们 将 w 称 为 模板 ， 而 将 相关 称 为 模板 匹配 。 可 


以 证 明 (见习 题 12.7) ，y(x,») 的 值 域 为 [1,1]， 因 而 f 和 w 的 幅度 变化 
是 归 一 化 的 。 当 归 一 化 的 w 和 了 中 对 应 的 归 一 化 区 域 相同 时 ，y(x, y) th ; 


现 最 大 值 。 这 说 明了 最 大 相关 ( 即 最 好 可 能 的 匹配 ) 。 当 两 个 归 一 化 函数 在 式 (12.2-8) 的 意义 下 表现 出 
最 小 相似 性 时 , 会 出 现 最 小 值 。 相 关系 数 不 能 用 传 里 叶 变换 来 计算 ,因为 该 式 中 存在 非 线性 项 (除法 和 
FI) « 

图 12.8 说 明了 刚才 讨论 的 步骤 的 机 理 。 如 3.4.2 节 中 
解释 的 那样 ， 当 w 的 中 心 位 于 了 的 边界 上 时 ， 围绕 f 的 边 
界 需要 进行 填充 (在 模板 匹配 中 ， 当 模板 的 中 心 越过 图 像 
的 边界 时 ,相关 的 值 通常 并 不 重要 , 因此 填充 被 限制 为 模 
板 宽度 的 一 半 ) 。 为 表示 方便 ， 我 们 通常 只 关心 奇数 大 小 
的 模板 。 中 心 在 任意 位 置 -7 

图 12.8 显示 了 一 个 大 小 为 mxn 的 模板 ,其 中 心 位 于 任 nner 
意 位 置 (x, 7)。 在 这 一 点 的 相关 可 以 用 式 (12.2-8) 得到。 然后 ， 
模板 的 中 心 移 到 一 个 相 邻 位 置 ， 重 复 该 过 程 。 通 过 移动 模 
板 的 中 心 ( 即 增 大 x A y) ,以 便 w 的 中 心 访问 f 中 的 每 个 像 
R, 可 得 到 所 有 的 相关 系数 yx, y)。 在 这 一 过 程 的 最 后 , 我 
们 寻找 xx 人 中 的 最 大 值 ， 进 而 找到 出 现 最 好 匹配 的 位 置 。 
在 yx, 少 中 可 能 会 有 多 个 位 置 出 现 最 大 值 ， 此 时 表明 w 和 之 间 有 多 个 匹配 。 


a 12.2 TR . : : : . < Z A 











图 12.8 ”模板 匹配 的 机 理 
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正比 ， 并 且 所 有 的 负 相 关 都 截 为 0( 黑 ) ， 以 简化 该 图 像 的 视觉 分 析 。 相 关 图 像 的 最 亮点 在 接近 腿 风 眼 的 位 
置 清晰 可 见 。 图 12.9(d) 将 最 大 相关 显示 为 一 个 白 点 (此 时 , 存在 一 个 最 大 值 为 1 的 唯一 匹配 ) , 我 们 看 到 它 
与 图 12.9 (a) 中 的 飓风 眼 位 置 紧密 对 应 。 





cd 


112.9 (a) WX, “安德鲁 ”的 卫星 图 像 , HEF 1992 48H 24H; (b) 飓风 眼 的 模板 ;， (ce) 显示 为 图 像 的 相关 系数 ( 注 
意 最 亮点 ) ; (d) 匹配 最 好 的 位 置 。 该 点 是 单个 像素 ， 但 其 已 被 放大 ， 以 便于 查看 ( 原 图 像 由 NOAA 提供 ) 


前 述 讨 论 表明 ， 可 以 对 被 处 理 的 函数 的 灰 度 值 变化 进行 归 一 化 相关 。 对 尺寸 和 旋转 归 一 化 是 
一 个 更 复杂 的 问题 。 尺 寸 归 一 化 涉及 空间 缩放 ， 正 如 2.6.5 节 和 4.5.4 节 中 解释 的 那样 ， 即 图 像 重 
采样 。 为 了 使 重 采样 有 意义 必须 知道 被 重新 缩放 的 图 像 的 大 小 。 在 某 些 情况 下 ， 这 可 能 变 成 一 
个 很 困难 的 问题 ， 除 非 是 在 有 空间 线索 可 用 的 情况 下 。 例 如 ， 在 迁 感应 用 中 ， 如 果 已 知 成 像 传 感 
器 的 观察 几何 (典型 情况 ) ， 假 设 视角 固定 ， 那 么 知道 传感器 相对 于 成 像 区 域 的 高 度 将 足以 归 一 化 
图 像 太 寸 。 类 似 地 ， 旋 转 归 一 化 要 求 已 知 图 像 被 旋转 的 角度 。 这 再 一 次 要 求 空 间 线索 。 在 刚才 给 
出 的 遥感 例子 中 ， 飞 行 方向 可 能 足以 把 下 感 图 像 旋转 到 一 个 标准 方向 。 在 没有 约束 条 件 的 情形 下 ， 
尺寸 和 旋转 归 一 化 会 成 为 相当 具有 挑战 性 的 任务 ， 因 为 它 要 求 自动 检测 可 作为 空间 线索 的 图 像 特 
性 (如 11 章 讨论 的 那样 ) 。 


12.2.2 ”最 佳 统计 分 类 器 


本 节 讨 论 一 种 识别 的 概率 方法 。 就 像 在 大 多 数 处 理 测度 和 判读 物理 事件 的 领域 中 那样 , 在 模式 识别 中 
对 概率 的 考虑 十 分 重要 ， 因 为 此 时 模式 类 通常 会 随机 生成 。 如 下 面 的 讨论 所 示 ， 在 平均 意义 上 有 可 能 推导 
出 一 种 最 佳 分 类 方法 ， 用 这 种 方法 会 产生 最 低 的 错误 分 类 的 概率 (见习 题 12.10) 。 


基础 知识 


RAKE, WERK x 的 概率 表示 为 p(@/x)。 如 果 模 式 分 类 融 判 断 x 来 自 类 必 ， 而 实际 上 它 来 自 
Ko, 那么 分 类 器 就 会 导致 一 次 损失 ,表示 为 L;。 由 于 模式 x 可 能 属于 所 考虑 的 下 个 类 中 的 任何 一 个 
类 ， 故 将 模式 x 赋予 类 多 的 平均 损失 为 





Ww 
rj (x)= $ Ly PR /x) (12.2-9) 


k= 

该 式 在 决策 理论 术语 中 通常 称 为 条 件 平均 风险 或 损失 。 aiai 
由 基础 概率 论 可 知 , p(A/B) = [p(4)p(8/4)]/p(B)。 使 用 该 式 , 我 们 可 jy 本 的 网 站 | 
将 式 (12.2-9) 写 为 






1 Ww 
r (x)= mae p(x/@,)P(@,) (12.2-10) 


RP, po ERKAK o, 的 模式 的 概率 密度 函数 ，P(@) 是 类 @ 出 现 的 概率 (有 时 这 些 概 率 称 为 先 
验 概率 ) 。 由 于 1/p(x) 为 正 ， 且 对 所 有 的 r(x),j= 1,2,…, 刺 都 是 如 此 , 故 可 将 它 从 式 (12.2-10) 中 忽 
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略 而 不 影响 这 些 函数 从 最 小 值 到 最 大 值 的 相对 顺序 。 然 后 ， 平 均 损 失 的 表达 式 就 简化 为 


Ww 
r(x) =) Ly p(x/@,)P(@) (12.2-11) 
k=l 


分 类 器 有 丈 个 可 能 的 类 , 任何 给 定 的 未 知 模式 可 从 这 些 类 中 选择 。 如 果 分 类 器 为 每 个 模式 x TT 
r(x), 00，… mco， 并 将 该 模式 以 最 低 损失 赋 给 相应 的 类 , 则 关于 所 有 决策 的 总 体 平均 损失 将 是 最 低 
的 。 这 种 将 总 体 平 均 损 失 降 至 最 低 的 分 类 器 称 为 贝 叶 斯 分 类 器 。 因 此 ， 如 果 mo < r(x), = 1,2,--°, W 
Ej i, 那么 贝 叶 斯 分 类 器 将 未 知 模式 x 赋 给 类 必 。 换 句 话 说， 如 果 对 所 有 的 / Eji A 


wW wW 
rœ =Y Ly p(x/@, )P(O) < 》 Lyp o, Plo) (12.2-12) 
k=1 n q=1 
那么 x 将 赋 给 类 。 正 确 决策 的 损失 通常 被 赋予 零 值 ， 而 不 正确 决策 的 损失 通常 被 赋予 相同 的 非 零 值 
(譬如 值 1) 。 在 这 些 条 件 下 ， 损 失 函 数 变 为 
Ly =1-6, (12.2-13) 


式 中 , i=j 时 6;y=1, i#j 时 =0。 式 (12.2-13) 表 明 ， 不 正确 决策 的 损失 是 1， 正 确 决 策 的 损失 是 0。 
将 式 (12.2-13) 代 入 式 (12.2-11) 得 到 


Ww 
r)(x) =} (1-5,) px/ OP(O) = P(x) = p(x/@,)P(@;) (12.2-14) 
k=l 
QO FET ATA AY j # iA 
P(x) — p(x/@,)P(@,) < P(x)— p(x/a@,;)P(@;) (12.2-15) 
或 等 价 地 有 
P(x/@;)P(@;)> p(x/o)P(@) j=1,2, =, W; j#i (12.2.16) 


IBZ DLA SAE x WAK o. 参考 推导 出 式 (12.2-1) 的 讨论 , 我 们 知道 0-1 损失 函数 的 贝 叶 斯 
分 类 器 不 过 是 如 下 形式 的 决策 函数 的 计算 : 

d(x)=p(x/w PO) j=1,2,.,W (12.2-17) 
式 中 ， 模 式 癌 量 x 赋 给 其 决策 函数 取得 最 大 值 的 类 。 

式 (12.2-7) 给 出 的 决策 函数 在 最 小 化 错误 分 类 中 的 平均 损失 方面 是 最 佳 的 。 然 而 ， 要 保持 这 一 最 
佳 性 ， 就 必须 知道 每 个 类 中 的 模式 的 概率 密度 函数 及 每 个 类 出 现 的 概率 。 后 一 要 求 通常 不 成 问题 。 例 
如 ， 如 果 所 有 的 类 等 概率 出 现 ， 那 么 p(wz) = 1/ 丈 。 即 使 该 条 件 不 正确 ， 由 该 问题 的 知识 我 们 通常 也 可 
以 推出 这 些 概率 。 概 率 密度 函数 PCw 四 的 估计 则 是 另 一 回 事 。 如 果 模 式 向 量 x 是 寺 维 的 ,那么 PCwdw) 
是 一 个 元 函数 ， 如 果 该 函数 的 形式 未 知 ， 就 需要 使 用 多 元 概率 论 方法 来 对 它 进行 估计 。 这 些 方法 在 
实际 应 用 中 很 困难 ， 代 表 每 一 类 的 模式 数目 不 大 或 概率 密度 函数 潜在 的 形式 不 能 很 好 地 表示 时 ， 尤 其 
如 此 。 由 于 这 些 原因 ， 使 用 贝 叶 斯 分 类 器 时 ， 通 常 假 设 对 各 种 密度 函数 有 一 个 解析 表达 式 ， 且 来 自 每 
个 类 的 样本 模式 有 一 个 必需 的 参数 估计 。 目 前 ，p(x/@) 的 最 为 通用 的 假设 形式 是 高 斯 概率 密度 函数 。 
这 种 假设 与 真实 情况 越 接 近 ， 贝 叶 斯 分 类 器 方法 在 分 类 中 就 越 能 接近 最 小 平均 损失 。 


高 斯 模式 类 的 贝 叶 斯 分 类 器 


我 们 先 考虑 一 个 一 维 问题 , 该 问题 包含 有 由 高 斯 密度 决定 的 两 个 模式 类 (WW=2) ,这 两 个 模式 类 的 
均值 分 别 为 mw 和 m,， 标 准 差分 别 为 a 和 o 。 由 式 (12.2-17) 可 知 ， 贝 叶 斯 决策 函数 的 形式 为 
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(m,y 


T e ° Pœ), j=1,2 (12.2-18) 
j 





d (x) = p(x/@,)P(@,;) = 


其 中 , 这 些 模式 现在 是 标量 , 由 x 表示。 图 12.10 显示 了 这 两 类 的 概率 


密度 函数 曲线 。 两 类 之 间 的 边界 是 一 个 单 点 ， 它 由 满足 di(xo) = dz(xo) | 1033 节 中 提 及 的 那样 ,一 元 由 

策 边 界 是 满足 pwyenD)=PGww) 的 加 值 。 如 图 12.10 所 示 , 该 点 是 两 个 
概率 密度 函数 的 交点 。 任 何 处 于 交点 右 侧 的 模式 (点 ) 都 被 划 归 类 办。 同样 ,任何 处 于 zx 点 左 侧 的 模式 
(点 ) 都 被 划 归 类 力 。 当 两 个 类 出 现 的 概率 不 相等 时 ， 如 果 类 mw 出 现 的 概率 大 ， 则 点 wo 左 移 ; 反之 ， 如 
REO, 出现 的 概率 大 , 则 点 和 右 移 。 这 是 我 们 期 望 的 结果 ， 因 为 分 类 器 总 是 试图 将 错误 分 类 的 损失 降 
至 最 低 。 例 如 ， 在 极端 情形 下 ， 如 果 类 cw 从 不 出 现 ， 那 么 分 类 器 总 是 将 所 有 模式 划 归 类 mw ( 即 点 wo 移 
向 负 无 穷 大 ) ， 故 从 不 会 出 现 错误 。 

在 n 维 情形 下 ,第 j 个 模式 类 中 的 向 量 的 高 斯 密度 为 
1 -1 (x-m, J" C! (x-m;) 


P(x/@;)=———_ pe (12.2-19) 
(2n)""|C,| 









Pa p(x/w2) 


a p(x/w ) 


概率 密度 


x 


mM Xo mi 


图 12.10 ”两 个 一 维 模式 类 的 概率 密度 函数 。 如 果 两 个 类 出 现 的 概率 相等 ， 那 么 所 示 的 点 xo 就 是 决策 边界 
其 中 ,每 个 密度 完全 由 其 均值 向 量 四 和 协 方差 矩阵 C 确 定 ， 均 值 向 量 和 协 方差 矩阵 定义 如 下 : 
m, = E,{x} (12.2-20) 


All 

C,=E,{(x-m,)(x—m,)"} (12.2-21) 
AH, £,{} 表示 类 @ 的 模式 的 自 变量 的 期 望 值 。 在 式 (12.2-19) 中 , n 是 模式 向 量 的 维度 ，|C| 是 矩阵 
Ci 的 行列 式 。 使 用 所 讨论 量 的 平均 值 来 近似 期 望 值 有 已 ， 可 得 到 均值 向 量 和 协 方差 矩阵 的 估计 ， 即 


1 
m; y 28 x (12.2-22) 
All 
Ga xx! —m jm; (12.2-23) 
N, DO k 


式 中 , 六 是 来 自 类 信 的 模式 向 量 的 数量 ， 求 和 操作 对 所 有 这 些 向 量 执行 。 在 本 节 后 面 ， 我 们 将 给 出 一 


2 个 如 何 使 用 这 两 个 表达 式 的 例子 。 
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协 方差 矩阵 是 对 称 的 和 半 正 定 的 。 如 11.4 节 中 解释 的 那样 ， 对 角 线 [一 
元 素 cw. 是 模式 向 量 的 第 个 元 素 的 方差 ， 非 对 角 线 元 素 oy 是 入 的 | SPT RHEL, 
协 方差 。 当 协 方差 矩阵 的 非 对 角 线 元 素 均 为 零 时 ， 多 元 高 斯 密度 函数 就 
简化 为 x 的 每 个 元 素 的 单 变量 的 高 斯 密度 的 乘积 。 当 向 量 元 素 六 和 区 不 相关 时 ， 会 出 现 这 种 情况 。 

根据 式 (12.2-17) ， 类 必 的 贝 叶 斯 决策 函数 为 d(x)=p(x/@)P(@3)。 然 而 ， 由 于 高 斯 密度 函数 的 指数 
形式 ， 用 这 个 决策 函数 的 自然 对 数 形式 更 为 方便 。 换 名 话说， 我 们 可 以 使 用 如 下 形式 : 


dj(x)=In| p(x/@,)P(o,) |=In[ p(x/a,)+In P(@,) | (12.2-24) 


从 分 类 性 能 方面 看 ， 该 表达 式 等 同 于 式 (12.2-17) ， 因 为 对 数 函 数 是 单调 递增 函数 。 换 句 话说， 式 (12.2-17) 
中 的 决策 函数 的 数值 顺序 与 式 (12.2-24) 中 的 数值 顺序 是 相同 的 。 将 式 (12.2-19) 代 入 式 (12.2-24) 中 可 得 


请 查阅 本 书 的 网 站 。 





d=InP(0) -Pn2r In|C-3 [Cm))" C7 (x—m))] (12.2-25) 
项 (n/2)In 2r 对 所 有 的 类 都 是 相同 的 ， 因 此 可 以 从 式 (12.2-25) 中 消去 ， 消 去 该 项 后 的 式 (12.2-25) 变 为 
d,(x)=In P(o,) -In|C,|==[ (xm, J" C; (e-m) (12.2-26) 


式 中 j= 1, 2,+++,W. IN (12.2-26) 表示 高 斯 模式 类 在 0-1 损失 函数 条 件 下 的 贝 叶 斯 决策 函数 。 

式 (12.2-26) 中 的 决策 函数 是 超 二 次 曲面 (n 维 空间 中 的 二 次 函数 ) ， 因 为 出 现在 该 式 中 的 x 的 分 量 
的 各 项 没有 高 于 二 次 的 。 毫 无 疑问 ， 高 斯 模式 的 贝 叶 斯 分 类 器 的 作用 至 多 是 将 一 个 通用 二 阶 决策 面 放 
到 两 个 模式 类 之 间 。 然 而 ， 如 果 模 式 总 体 确实 是 高 斯 的 ， 则 在 分 类 中 不 会 有 其 他 曲面 所 产生 的 损失 小 
于 平均 损失 。 

如 果 所 有 的 协 方差 矩阵 都 相等 ， 则 C= C,j= 1, 2,…, Wo 展开 式 (12.2-26) 并 消去 所 有 独立 于 /7 的 
项 ， 可 得 
1 


d,(x)=In P(@;)+x'C'm, -FMC im p (12.2-27) 
这 是 一 个 线性 决策 函数 ( 超 平面 ) FETA = 1,2,…, Wo 
另外 ， 如 果 C=7， 这 里 了 是 单位 矩阵 ， 且 P(@)=1/W,j7=1,2,---,W, WA 
d,(x)=x'm,->m™m, J= 0 (12.2-28) 


5 oe 
这 些 是 最 小 距离 分 类 器 的 决策 函数 ,就 像 式 (12.2-5) 中 给 出 的 一 样 。 如果 : (1) 这 些 模式 类 都 是 高 斯 的 ， 
(2) 所 有 协 方差 矩阵 都 等 于 单位 矩阵 ， 并 且 (3) 所 有 类 出 现 的 概率 相等 ， 则 在 贝 叶 斯 意义 上 最 小 距离 分 类 
右 是 最 佳 的 。 满 足 这 些 条 件 的 高 斯 模式 类 是 n 维 空间 中 外 形 相同 的 球状 云 团 ( 称 为 超 球面 ) 。 最 小 距离 分 
类 器 在 每 对 类 之 间 建 立 一 个 超 平面 ， 超 平面 有 如 下 特性 ， 它 是 连接 这 对 超 球 面 的 中 心 的 垂直 平分 线 。 在 
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图 12.11 两 个 简单 医 及 其 贝 叶 斯 决策 边界 (阴影 所 示 ) 


贝 叶 斯 分 类 器 方法 最 成 功 的 应 用 之 一 是 ,对 由 飞行 器 、 卫 星 或 空间 站 上 携带 的 多 光谱 扫描 器 生成 的 
遥感 图 像 进行 分 类 。 对 这 些 平台 上 产生 的 大 量 图 像 数据 使 得 图 像 自动 分 类 和 分 析 ， 已 成 为 遥感 的 重要 任 
务 。 遥 感应 用 相当 广泛 ， 包 括 土地 利用 调查 ， 农 作物 产量 调查 ， 农 作物 灾害 检测 ， 森 林 、 空 气质 量 和 水 
质 监测 ， 地 质 研究 ， 天 气 预 报 ， 以 及 其 他 许多 对 环境 有 重要 意义 的 领域 。 下 例 显示 了 一 个 典型 应 用 。 
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红外 波段 。 按 这 种 方式 扫描 一 个 区 域 , 会 生成 该 区 Z 
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域 的 4 REER, ENEBIR MEENE HEE 





已 在 空间 上 配 准 (实践 中 满足 的 一 个 条 件 ) , 那么 可 BE 





将 这 些 图 像 想 象 为 堆 释 在 一 起 ,如 图 12.12 所 示 。 这 EEE 





样 ， 就 像 我 们 在 11.4 节 中 所 做 的 那样 ， 地 面 上 的 每 reres 
个 点 都 可 以 由 形 如 x= 6 p e ATRE |。 AS 
式 向 量 表示 ， 其 中 x 为 蓝光 图 像 ，x, KAR, |x 

等 等 。 如 果 这 些 图 像 的 大 小 都 是 512x512 像素 , 那么 

这 4 幅 多 光谱 图 像 的 每 种 堆 生 可 由 266 144 个 四 维 模 
式 向 量 表示 。 像 前 面 说 明 的 那样 ， 高 斯 模式 的 贝 叶 


























斯 分 类 器 要 求 估计 每 个 类 的 均值 回 量 和 协 方差 矩 


阵 。 在 遥感 应 用 中 ， 这 些 估计 是 通过 从 每 个 感 兴趣 图 12.12 ”由 多 光谱 扫描 器 生成 的 4 幅 数字 图 像 
经 像素 配 准 后 ， 所 形成 的 模式 向 量 


区 域 中 收集 其 类 别 已 知 的 多 光谱 数据 得 到 的 。 然 
后 ， 就 像 在 例 12.3 中 那样 ， 结 果 向 量 用 于 估计 所 需 的 均值 向 量 和 协 方差 矩阵 。 


波段 


波段 2 


波段 3 


波段 4 


图 12.13 (a) 到 (d) 是 华盛顿 特区 的 4 幅 大 小 为 S12x512 的 多 光谱 图 像 ， 这 些 图 像 是 在 前 段 中 提 及 的 波段 
范围 拍摄 的 。 我 们 的 兴趣 是 把 由 这 些 图 像 包 含 的 区 域 中 的 像素 分 类 到 3 个 模式 类 之 一 : 水 体 、 市 区 和 植被 。 
图 12.13 (e) 中 的 模板 已 去 加 到 这 些 图 像 上 ， 以 提取 这 3 个 类 的 由 型 样本 。 样 本 的 一 半 用 于 训练 ( 即 估 计 均 值 
向 量 和 协 方差 矩阵 ) ， 男 一 半 用 于 独立 测试 ， 以 评估 初始 分 类 器 的 性 能 。 在 无 约束 条 件 的 多 光谱 数据 分 类 中 ， 
由 于 通常 并 不 知道 先 验 概率 P(w) ， 所 在 我 们 在 这 里 假设 它们 是 相等 的 ， 即 P(@,)=1/3,i=1,2,3。 
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图 12.13 多 光谱 数据 的 贝 叶 斯 分 类 : (a)~(d) 可见 蓝光 、 可 见 绿 光 、 可 见 红 光 和 近 红 外 波长 图 
像 ; (e) 显示 (1) 水 体 、(2) 市 区 和 (3) 植 被 的 样本 区 域 的 模板 ; (分 类 结果 。 黑 点 表 





示 未 正确 分 类 的 点 , 其 他 ( 白 ) 点 是 正确 分 类 的 点 ;(g) 分 类 为 水 体 的 所 有 图 像 像 素 ( 白 
色 ) ; (h) 分 类 为 市 区 的 所 有 图 像 像素 (白色 ) ; 0 分 类 为 植被 的 所 有 图 像 像 素 (白色 ) 
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表 12.1 多 光谱 图 像 数 据 的 贝 叶 斯 分 类 


训练 模式 无 关 模 式 
已 划分 的 类 已 划分 的 类 





中 看 不 到 时 点 ， a A E MA 

-图 12.13 (g) BI) 人 更 为 有 趣 。 这 里 ， 我 们 使 用 从 训 纵 数据 中 歼 取 的 均值 向 量 和 协 方差 红 阵 ， 将 所 有 图 像 
像素 分 为 了 三 个 类 别 之 一 图 12.13(g) 以 白色 显示 了 分 类 为 水 体 的 所 有 像素 。 未 被 分 类 为 水 体 的 像素 使 用 
昭 色 显示 。 我 们 看 到 ， 贝 叶 斯 分 类 器 对 确定 哪 一 部 分 是 水 体 的 工作 做 得 很 出 色 。 图 12.13 (h) 以 白色 显示 了 
市 区 发 展 的 所 有 像素 系统 出 色 地 识别 了 市 区 特性 ， 如 桥梁 和 高 速 公路 。 图 12.13 @ 显示 了 被 分 类 为 植被 
的 像素 -图 12113 的 表明 中 心 城区 的 白色 像素 高 度 集 中 ,其 密 底 与 到 图 像 中 心 的 中 离 为 要 道 大 图 12.13 (i) 
显示 了 相反 的 效果 ， 表明 图 像 的 中 心 植 被 很 少 ， 而 在 城市 开发 区 植被 最 多 。 


我 们 在 10.3.3 节 开 始 时 曾 提 到 过 ， 阔 值 处 理 可 视 为 贝 叶 斯 问题 ， 它 最 佳 地 将 模式 赋 给 两 个 类 或 多 
个 类 。 事 实 上 ， 如 前 一 问题 所 示 ， 逐 像素 地 分 类 实际 上 是 一 个 分 割 问题 ， 即 把 一 幅 图 像 分 成 两 个 或 多 
个 可 能 的 区 域 。 如 果 仅 使 用 一 个 单 变量 ， 则 式 (12.2-17) 变 成 一 个 最 佳 函数 ， 它 基于 一 幅 图 像 的 像素 的 
灰 度 来 分 割 该 图 像 ， 就 像 我 们 在 10.3 节 中 所 做 的 那样 。 记 住 ; 最 佳 性 要 求 已 知 每 个 类 的 概率 密度 函数 
和 先 验 概率 。 如 前 面 提 及 的 那样 , 估计 这 些 密 度 并 不 容易 。 如 果 必 须 做 出 假设 (譬如 假设 为 高 斯 密度 ) ， 
则 在 分 割 中 所 能 实现 的 最 佳 程度 ， 与 这 些 假设 接近 真实 情况 的 程度 成 正比 。 


12.2.3 ”神经 网 络 


前 两 节 讨论 的 方法 使 用 样本 模式 来 估计 每 个 模式 类 的 统计 参数 。 最 小 距离 分 类 器 完全 由 每 个 类 的 
均值 向 量 来 确定 。 类 似 地 ， 对 于 总 体 为 高 斯 分 布 的 贝 叶 斯 分 类 器 ， 完 全 由 每 个 类 的 均值 向 量 和 协 方差 
和 矩阵 确定 。 用 于 估计 这 些 参 数 的 (已 知 其 所 属 的 类 ) 模式 通常 称 为 训练 模式 ， 来 自 每 个 类 的 这 样 一 组 模 
式 称 为 训练 集 。 使 用 训练 集 得 到 决策 函数 的 过 程 称 为 学 习 或 训练 。 

在 刚才 讨论 的 两 种 方法 中 ， 训 练 很 简单 。 每 个 类 的 训练 模式 被 用 于 计算 对 应 于 该 类 的 决策 函数 的 
参数 。 估 计 出 问题 中 的 参数 后 ， 分 类 器 的 结构 就 被 固定 ， 且 其 最 终 的 性 能 将 取决 于 实际 模式 总 体 是 否 
满足 所 用 分 类 方法 推导 中 所 做 的 统计 假设 。 

一 个 问题 中 的 模式 类 的 统计 特性 通常 是 未 知 的 , 或 者 是 无 法 估计 的 (回想 前 一 节 中 关于 多 元 统计 的 
难点 的 简单 讨论 ) 。 实 际 上 ， 此 类 决策 理论 问题 最 好 由 直接 通过 训练 生成 所 需 决策 函数 的 方法 来 处 理 。 
然后 ， 没 有 必要 再 做 关于 基本 的 概率 密度 函数 或 关于 所 考虑 模式 类 的 其 他 概率 信息 的 假设 。 本 节 讨 论 
满足 这 一 准则 的 各 种 方法 。 


背景 知识 


以 下 内 容 的 本 质 是 使 用 大 量 的 基本 非 线 性 计算 单元 ( 称 为 神经 元 ) ， 这 些 单元 以 网 络 的 形式 进行 组 
20 织 ， 就 像 大 脑 中 互 连 的 神经 元 那样 。 得 到 的 模型 有 各 种 各 样 的 名 称 ， 包 括 神经 网 络 、 神 经 计算 机 、 
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并 行 分 布 式 处 理 (PDP) 模型 、 神 经 形态 学 系统 、 分 层 自 适应 网 络 和 连接 模型 。 这 里 ， 我 们 使 用 神经 网 
络 这 一 名 称 ， 或 简称 为 神经 网 。 我 们 使 用 这 些 网 络 作为 工具 ， 通 过 对 模式 的 训练 集 的 逐次 描述 ， 自 适 
应 地 导出 判别 函数 的 系数 。 

神经 网 络 受到 关注 可 以 追溯 至 20 世纪 40 年 代 早期 ， 详 见 McCulloch and Pitts[1943]。 他 们 提出 
了 神经 元 模型 , 该 模型 用 二 进 制 门限 器 件 和 包括 0-1 与 1-0 的 神经 状态 突变 的 随机 算法 , 作为 神经 系 
统 建 模 的 基础 。Hebb[1949] 的 后 续 工 作 以 数学 模型 为 基础 ， 该 模型 试图 通过 增强 或 联合 来 掌握 学 习 
这 一 概念 。 

20 世纪 50 年 代 中 期 至 60 年 代 早 期 ，Rosenblatt[1959，1962] 发 明 学 习 机 引起 了 模式 识别 理论 领 
域 研究 人 员 和 从 业者 的 巨大 兴趣 。 人 们 对 这 些 称 为 感知 机 的 机 器 如 此 关注 的 原因 是 ， 数 学 证 明 的 进 
展 显示 : 使 用 线性 可 分 的 训练 集 ( 即 由 一 个 超 平面 分 隔 的 训练 集 ) 进行 训练 时 ， 这 些 感知 机 会 在 有 限 
数量 的 迭代 步骤 后 收敛 到 一 个 解 。 采 用 超 平面 系数 形式 的 这 个 解 ， 能 正确 地 分 离 由 该 训练 集 的 模式 
表示 的 类 。 

遗憾 的 是 ， 人 们 很 快 就 对 看 起 来 有 良好 理论 基础 的 学 习 模 型 大 失 所 望 。 当 时 ， 基 本 的 感知 机 及 其 
推广 还 很 简单 ， 不 足以 解决 多 数 有 实际 意义 的 模式 识别 任务 。 后 来 ， 通 过 研究 多 层 这 样 的 器 件 ， 人 们 
试图 扩展 类 感知 机 的 能 力 ， 尽 管 它们 在 概念 上 很 吸引 人 ， 但 都 缺乏 原型 感知 机 那样 有 效 的 训练 算法 。 
Nilsson[1965] 总 结 了 20 世纪 60 年 代 中 期 学 习 机 领域 的 状况 。 几 年 后 ，Minsky andPapert[1969] 提 出 了 
类 感知 机 机 器 的 局 限 性 这 一 令 人 气 绥 的 分 析 。 这 一 看 法 一 直 持 续 到 20 世纪 80 年 代 中 期 ， 佐 证 文献 见 
Simon[1986]。 在 这 篇 最 初 于 1984 年 以 法 文 发 表 的 文章 中 ，Simon 以 “一 个 神话 的 诞生 和 死亡 ”为 题 
驳斥 了 感知 机 。 

Rumelhart, Hinton and Williams[1986] 对 多 层 感知 机 的 新 训练 算法 的 研究 ， 使 得 事情 出 现 了 转机 。 
他 们 的 基本 方法 (通常 称 为 反 向 传播 方式 学 习 的 通用 delta 法 则 ) , 为 多 层 机 器 提供 了 一 种 有 效 的 训练 方 
式 。 尽管 不 能 像 证 明 单 层 感知 机 那样 证 明 这 种 训练 算法 也 收敛 到 一 个 解 , 但 通用 delta 法 则 已 成 功 地 解决 
了 大 量 的 实际 问题 。 这 一 成 功 使 得 多 层 类 感知 机 已 成 为 当前 所 用 神经 网 络 的 主要 模型 之 一 。 


两 个 模式 类 的 感知 机 


在 这 种 最 基本 的 形式 中 ， 感 知 机 学 习 一 个 线性 决策 函数 ， 该 决策 函数 对 分 两 个 线性 可 分 的 训练 集 。 
图 12.14 (a) 显示 了 两 个 模式 类 的 感知 机 模型 。 这 个 基本 装置 的 响应 基于 其 输入 的 加 权 和 ， 即 


d(x) = t} Wi Xi + Wry (12.2-29) 
i=l a 


这 是 一 个 与 模式 向 量 的 分 量 有 关 的 线性 决策 函数 。 称 为 权重 的 系数 w, i = 1, 2,…, n,n + 1 在 对 输入 求 
和 前 ， 对 这 些 输入 进行 修正 ， 并 馈送 到 阔 值 单元 中 。 在 这 一 意义 上 ， 权 重 类 似 于 人 类 神经 系统 中 的 神 
经 突 触 。 将 求 和 连接 的 输出 映射 为 该 装置 的 最 终 输 出 的 函数 ， 有 时 称 为 激活 函数 。 

当 d(x) > 0 时 ， 阔 值 单元 使 感知 机 的 输出 为 +1， 这 表明 模式 x 被 识别 为 属于 类 wm。 当 dx) <0 时 , 情 
形 正好 相反 。 这 种 操作 模式 与 之 前 的 注释 为 两 个 类 使 用 单个 决策 函数 的 式 (12.2-2) 是 一 致 的 。 当 dx)=0 时 ， 
x 位 于 分 隔 两 个 模式 类 的 决策 面 上 ， 这 给 出 了 一 个 不 能 确定 的 条 件 。 由 感知 机 实现 的 决策 边界 是 通过 
令 式 (12.2-29) 等 于 零 得 到 的 : 


d(x) =} wx; +w, =0 (12.2-30) 





WX, + WX ++ Ww, x, +W,,) =O (12.2-31) | 


四 
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这 是 在 n 维 模式 空间 中 的 一 个 超 平面 方程 。 几 何 上 ， 前 个 系数 确定 超 平面 的 方向 ， 而 最 后 一 个 系数 


wa 与 从 原点 到 超 平面 的 垂直 距离 成 正比 。 因 此 , 若 w, =0 ， 则 超 平面 通过 模式 空间 的 原点 。 类 似 
地 , 若 WwW=0， 则 超 平面 平行 于 忆 轴 。 
图 12.14 (a) 中 闽 值 单元 的 输出 取决 于 do 的 符号 。 替 代 测 试 整个 函数 来 确定 它 是 正 还 是 负 ， 我 们 
可 以 对 w,, 项 检验 式 (12.2-29) 的 求 和 部 分 ， 此 时 系统 的 输出 是 


n 
+1, DW > Wrst 


O= (12.2-32) 
D MX < W, 


该 实现 等 同 于 图 12.14(a) 并 显示 在 图 12.14(b) F, MEAS ANTAL, AR E —w,,, 取代 ， 且 常量 
单位 输入 不 再 出 现 。 在 本 节 后 面 讨论 多 层 神经 网 络 的 实现 时 ， 我 们 会 回顾 这 两 个 公式 的 等 价 性 。 


wy 


xy 





n 


d(x) = > WiXi + Wnt 


模式 向 量 awo 
x F 
y oe > 
; , dix) <0 
Xn 
1 
权重 
模式 向 量 +1, 3 wX > — Wnt 
x i=l 
=, > WiXi < — Wnt 
i=1 
a 
b 





图 12.14 ”两 个 模式 类 的 感知 机 模型 的 两 种 等 效 表示 


另 一 个 常用 的 公式 是 扩充 这 些 模式 向 量 ， 附 加 总 等 于 1 的 额外 的 第 (n+ 1) 个 元 素 ， 而 不 管 类 成 员 是 
什么 。 也 就 是 说 , 扩充 后 的 模式 向 量 是 从 模式 向 量 x 创建 的 , 方法 是 令 y= i= 1,2,…,n 并 附加 一 
个 额外 的 元 素 Yri = 1。 然 后 ， 式 (12.2-29) 变 为 
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os ees =w'y (12.2-33) 
i=l 
其 中 了 = (yi, Y, Ym 1] 现在 是 一 个 扩充 的 模式 向 量 ， 而 w= (wi, Wy…, Wm Wa+1) 称 为 权 向 量 。 该 表 
达 式 在 表示 时 通常 更 为 方便 。 然 而 ， 不 管 使 用 的 公式 是 什么 ， 关键 问题 都 是 使 用 来 自 两 个 类 的 一 个 给 
定 模式 向 量 训练 集 来 找到 wo 


训练 算法 “ 


下 面 的 讨论 中 给 出 的 算法 ， 都 是 过 去 几 年 来 为 训练 感知 机 提出 的 大 量 方法 中 的 代表 性 方法 。 

线性 可 分 的 类 : 用 于 求 两 个 线性 可 分 训练 集 的 权重 向 量 解 的 一 种 简单 迭代 算法 如 下 。 对 于 两 个 分 
别 属于 类 m 和 类 ow 的 扩充 模式 向 量 的 训练 集 , S w(1) 表 示 初 始 权 重 向 量 , 它 可 能 是 任意 选择 的 。 然后， 
在 第 k 步 迭代 中 ， 如 果 p(k) e o H wk 和 0， 则 使 用 下 式 代替 wk): 


w(k +1) =w(k) +cy(k) (12.2-34) 
式 中 , c 是 一 个 正 的 修正 增 量 。 相 反 ， 如 果 y (Re oH wyk > 0， 则 使 用 下 式 代替 wk): 
w(k +1) = w(k)—cy(k) (12.2-35) 
否则 ,保持 WORE: | 
w(k +1) = w(k) (12.2-36) 


该 算法 仅 当 正 考虑 模式 在 训练 序列 第 上 步 被 错误 分 类 时 ， 才 改变 w。 假 设 修正 增 量 c 为 正 ， 现 在 它 是 
一 个 常量 。 该 算法 有 时 称 为 固定 增 量 校正 准则 。 

当 两 个 类 的 整个 训练 集 循 环 通过 机 器 而 不 出 现任 何 错误 时 ， 该 算法 收敛 。 如 果 模 式 的 两 个 训练 集 
是 线性 可 分 的 ， 那 么 固定 增 量 校正 准则 会 在 有 限 步 内 收 么 。 称 为 感知 机 训练 定理 的 该 结果 的 证 明 ， 请 
参阅 Duda, Hart and Stork[2001]，Tou and Gonzalez[1974] 和 Nilsson[1965]。 
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正 。 由 于 仅 当 算法 对 所 有 训练 模式 完全 无 误 迄 代 时 ， 才能 得 到 一 个 解 ， 故 必须 再 次 提交 训练 集 。 机 器 学 习 
: h 下 方式 继续 : SI) =), WO) =y(2), y0 ) =7(3), y(8) =y(4), 并 以 同样 的 方式 进行 。X=14 时 收 








,得 到 的 权重 向 量 解 为 w(14) = (—2, 0, 1)". 相应 的 决策 本 数 是 aly) = 一 2y4+ lo pn a te 
RSM, 得 到 ， dee) = 一 26+1， 当 集合 等 于 0 时， 它 变 成 图 12.15 (b) 所 示 的 决策 边界 的 方程。 


不 可 分 的 类 : 实际 上 ， 线 性 可 分 的 模式 类 是 个 例外 ， 通 常情 况 并 非 如 此 。 因 此 ，20 世纪 60 年 代 
和 70 年代, 大 量 研究 工作 转向 处 理 不 可 分 模式 类 的 技术 开发 。 随 着 神经 网 络 训练 方面 取得 进展 , 解决 
不 可 分 行为 的 许多 方法 已 成 为 仅 具 有 历史 意义 的 课题 。 然 而 ， 一 种 早期 的 方法 与 该 讨论 直接 相关 ， 这 
就 是 原始 的 delta 规则 。 称 为 感知 机 训练 的 Widrow-Hoff 或 最 小 均 方 (LMS) delta 规则 ， 在 任何 训练 步 
又 都 会 使 得 实际 响应 与 期 望 响应 间 的 误差 最 小 。 


d(x) = —2x; 
X2 x2 
rf api 


O 1@ 


+1=0 ab 


O 








| naa E eE, 
0 1 





QO ew 
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图 12.15 (a) 属于 两 个 类 的 模式 ; (b) 由 训练 确定 的 决策 边界 
考虑 准则 函数 
Jw) = (rw yy (12.2-37) 


式 中 , 是 期 望 的 响应 ( 即 当 扩充 后 的 训练 模式 向 量 属于 类 四 时 有 = +1, TS y TFK AA 
r= 一 1) 。 为 在 >= my 时 求 该 函数 的 最 小 值 , 其 任务 是 在 .Jw) 的 相反 梯度 方向 逐步 调整 w, 即 该 最 小 值 
对 应 于 正确 的 分 类 。 如 果 w( 及 表示 第 步 迭 代 的 权重 向 量 ， 则 通用 梯度 下 降 算 法 可 写 为 





w(k+1)= -ol Z| (122-38) _ 
Ow w=w(k) 


FP w(k+ D 是 m AA, Hila > 0 给 出 修正 量 。 由 式 (12.2-37) 得 到 


Ow) _ 


a -(r-w" y)y (12.2-39) 


把 这 一 结果 代入 式 (12.2-38) 得 到 
w(k+1)=w(k)+ a| r(k) ~w'(k) yk) | y(k) (12.2-40) 


其 中 初始 权重 向 量 w(1) 是 任意 的 。 
9 通过 将 权重 向 量 中 的 增 量 (delta) 定义 为 
Aw = w(k+1)—w(k) (12.2-41) 
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我 们 可 以 按 delta 修正 算法 的 形式 将 式 (12.2-40) 写 为 
Aw = ae(k) y(k) (12.2-42) 
式 中 ， 
e(k) =r(k)—w" (k) y(k) (12.2-43) 
当 模 式 JWR 存 在 时 ， 它 是 权重 向 量 w( 有 提交 的 误差 。 
式 (12.2-43) 给 出 了 权重 向 量 w( 有 的 误差 。 如 果 把 它 更 改 为 w(k+1), 但 保持 模式 不 变 ， 则 误差 变 为 


e(k)=r(k)—w (k+l1)y(k) (12.2-44) 
故 误差 的 变化 是 
Ae(k) =| r(k)—w" (k +1) x(k) |-| r) -wT (CK) | 
=-[w"(k+1)- w"(k) | y(k) (12.2-45) 
=—Aw" y(k) 


{Ath F A w=ae(k)y (k, FRA 
Ae =—ae(k) y" (k) y(k) 
=-ae(k)|| (6 


因此 ,权重 的 变化 将 误差 减 小 了 aly 倍 。 下 一 个 输入 模式 开始 新 的 自 适应 循环 ， 将 下 一 个 误差 减 
Warly(k+ Dif 倍 ， 以 此 类 推 。 

a 的 选择 控制 着 稳定 性 和 收敛 速度 (Widrow and Stearns[1985]) 。 稳定 性 要 求 0< æ <2。 的 实际 
范围 是 0.1<w <1.0。 尽 管 这 里 未 给 出 证 明 , 但 式 (12.2-40) 或 式 (12.2-42) 和 式 (12.2-43) 的 算法 确实 收敛 
于 一 个 解 ， 这 个 解 会 使 得 在 该 训练 集 的 模式 上 的 均 方 误差 最 小 。 当 模式 类 可 分 时 ， 使 用 刚才 讨论 的 算 
法 得 出 的 解 ， 可 能 会 也 可 能 不 会 产生 一 个 分 离 超 平面 。 也 就 是 说 ， 在 感知 机 训练 理论 的 意义 上 ， 均 方 
误差 解 并 不 意味 着 真有 一 个 解 。 这 种 不 确定 性 是 使 用 这 个 特殊 的 公式 在 可 分 情形 下 和 不 可 分 情形 下 收 
敛 算 法 的 代价 。 

到 目前 为 止 ， 我 们 讨论 的 两 个 感知 机 训练 算法 可 以 推广 到 多 个 类 及 非 线性 决策 函数 。 基 于 前 面 给 
出 的 历史 评价 ， 这 里 探讨 多 类 训练 算法 并 无 多 大 价值 。 相 反 ， 我 们 将 在 神经 网 络 的 内 容 中 讨论 多 类 训 
练 问题 。 

多 层 前 馈 神经 网 络 


本 节 主 要 探讨 多 类 模式 识别 问题 的 决策 函数 ， 并 涉及 由 感知 机 计算 单元 的 各 个 层 组 成 的 结构 ， 与 
类 是 否 可 分 无 关 。 


基本 结构 : 图 12.16 显 示 了 所 考虑 神经 网 络 模型 的 结构 。 它 由 多 层 结 构 上 相同 的 计算 节点 (神经 元 ) 
排列 而 成 ， 从 而 一 层 中 的 每 个 神经 元 的 输出 送 到 下 一 层 的 每 个 神经 元 的 输入 。 称 为 层 4 的 第 一 层 中 的 
| 神经 元 的 个 数 为 Vi。 通 常 ，N =n， 它 是 输入 模式 向 量 的 维度 。 称 为 O 层 的 输出 层 中 的 神经 元 的 数量 
表示 为 No。No 等 于 丈 ， 即 神经 网 络 经 训练 后 用 于 识别 模式 类 的 数量 。 如 下 面 的 讨论 所 示 ， 如 果 该 网 
络 的 第 i 个 输出 为 “高 "， 而 其 他 输出 为 “ 低 "， 则 网 络 将 模式 向 量 x 识 别 为 属于 类 @。 

如 图 12.16 中 的 放大 部 分 所 示 ， 每 个 神经 元 的 形式 都 与 前 面 讨 论 的 感知 机 模式 相同 ( 见 图 12.14) , 
只 是 硬性 受 限 激活 函数 已 被 替代 为 软 性 受 限 “S 形 ” 函 数 。 在 开发 训练 规则 时 ， 需 要 有 沿 神经 网 络 所 
有 路 径 的 可 微分 性 。 下 面 的 “S 形 ”激活 函数 具有 必要 的 可 微分 性 : 


(12.2-46) 
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(12.2-47) 


-(1/+0,)/0, 


1 





1+e 


, M 是 该 网 络 第 7 层 中 的 每 个 节点 的 激活 元 素 的 输入 ，0 是 偏 移 量 ，0% 控制 “S 形 ” 


h,(,) 


1, Qe 


AP I,J 


AN 


函数 的 形状 。 


KN 
Nd 
(0) 

a 

















图 12.16 多 层 前 馈 神 经 网 络 模型 。 放 大 部 分 显示 了 整个 网 络 中 每 
个 神经 元 的 基本 结构 。 偏 移 量 4 仅 当做 另 一 个 权重 来 处 理 
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图 12.17 中 画 出 了 式 412.2-47) 的 曲线 ， 并 给 出 了 每 个 节点 的 “高 ”响应 限 和 “ 低 ” 响 应 限 。 因 此 ， 
在 使 用 这 个 特殊 的 函数 时 ， 对 所 有 大 于 4 的 了 值 ， 系 统 会 输出 一 个 “高 ”读数 。 同 样 ， 对 所 有 小 于 6 的 
/ 值 ， 系 统 会 输出 一 个 “ 低 ” 读 数 。 如 图 12.17 所 示 ,，“S 形 ” 激 活 函数 总 为 正 ， 并 且 仅 当 激 活 元 素 的 输入 
分 别 为 负 无 穷 或 正 无 穷 时 , 才 到 达 其 极限 值 0 和 1。 因 此 , 在 图 12.16 中 , 接近 0 和 1 的 值 (譬如 0.05 和 
0.95) 定义 了 神经 元 输出 的 “ 低 ” 值 和 “高 ” 值 。 原理 上 ， 不 同类 型 的 激活 函数 可 用 于 不 同 的 层 , 其 至 用 
于 神经 网 络 的 同一 层 中 的 不 同 节点 。 实 际 上 ， 常 用 的 方法 是 对 整个 网 络 使 用 相同 形式 的 激活 函数 。 


0O=h(1) 








图 12.17 式 (12.2-47) 给 出 的 “S 形 ” 激 活 函 数 


参考 图 12.14 (a), 图 12.17 中 显示 的 偏 移 量 9, 类似 于 前 面 讨论 感知 机 时 的 权重 系数 Wrst 这 个 偏 移 
MERR RHE 12.14 (a) 的 形式 来 实现 ， 方 法 是 将 偏 移 & 作为 一 个 额外 的 系数 ， 然 后 使 用 该 系数 来 
修正 统一 输入 到 网 络 中 所 有 节点 的 一 个 常量 。 为 遵循 文献 中 普遍 使 用 的 符号 表示 ， 我 们 未 把 单独 的 常 
量 输入 +1 显示 在 图 12.16 中 的 所 有 节点 上 。 取 而 代 之 ,这 个 输入 及 其 修正 权重 & 是 网 络 节点 的 求 和 部 
分 。 如 图 12.16 中 放大 部 分 显示 的 那样 ， 在 J 层 ，N 个 节点 中 的 每 个 节点 都 有 一 个 这 样 的 系数 。 

在 图 12.16 中 ,任何 层 中 的 一 个 节点 的 输入 ， 都 是 来 自前 一 层 的 输出 的 加 权 和 。 令 层 KK 表示 层 J 
的 前 一 层 ( 图 12.16 中 未 按 字母 顺序 来 划分 层 ) ， 层 KK 为 层 中 的 每 个 节点 的 激活 元 素 提 供 输入 了 : 


Nx 
i, => w0, (12.2-48) 
k=l 


式 中 j = 1, 2,…, Ny, 这 里 NÆ J PRESSO Me KPA, wa RI K PRT A 
0 在 送 入 层 J 中 的 节点 之 前 ， 修 正 这 些 输出 的 权重 。 层 天 的 输出 为 
O, = 及 (CD) (12.2-49) 

其 中 大 = 1, 2,--+, Ngo 

清楚 地 理解 式 (12.2-48) 中 所 用 的 下 标 符 号 很 重要 , 因为 我 们 在 本 节 的 剩余 内 容 中 都 会 用 到 它 。 首 先 ， 
注意 j= 1, 2,…, 入 表示 层 了 中 第 j 个 节点 的 激活 元 素 的 输入 。 因 此 ， n KREAJ PE 1 个 (顶端 ) 节点 
的 激活 元 素 的 输入 ,了 ,表示 层 7 中 第 2 个 节点 的 激活 元 素 的 输入 ， 以 此 类 推 。 层 中 的 每 个 节点 都 有 Nk 
个 输入 , 但 对 各 个 输入 的 加 权 是 不 同 的 。 因此 , 层 /中 第 1 个 节点 的 Nk 个 输入 由 系数 wi, k= 1,2,…，, Ng 
和 加权; 层 了 中 第 2 个 节点 的 输入 由 系数 wy, k= 1,2,… ,Nx 加 权 ; 以 此 类 推 。 因此 , 层 天 的 输出 在 送 入 层 
J 时 ,需要 指定 共 Ny x Nk 个 加 权 系数 。 完 全 指定 层 J 中 的 节点 ,需要 另外 Nj 个 偏 移 系数 0。 

将 式 (12.2-48) 代 入 式 (12.2-47) 得 到 


1 
htt, j= 


i Ee +0, \/e 
这 是 本 节 剩 余部 分 中 要 用 到 的 激活 函数 的 形式 。 


(12.2-50) 


> 
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在 训练 过 程 中 ， 修 改 输出 层 中 的 神经 元 很 简单 ， 因 为 每 个 节点 的 期 望 输 出 是 已 知 的 。 训 练 一 个 多 
层 网 络 的 主要 问题 在 于 调整 隐藏 屋 中 的 权重 ， 即 那些 非 输出 层 的 层 中 的 权重 。 


反 向 传播 训练 : 我们 先 来 关注 输出 层 。 (输出 ) 层 2 中 各 节点 的 期 望 响应 r 和 相应 真实 响应 0, 之 
间 的 总 误差 的 平方 为 


N. 
ay 2 
Eos (7, —O,) (12.2-51) i 
q=l 


其 中 No 是 输出 层 2 中 的 节点 数 ， 使 用 系数 1/2 是 为 后 面 取 导 数 更 为 方便 。 

我 们 的 目的 是 ， 推 导 一 个 类 似 于 delta 规则 的 训练 规则 ， 以 便 按 寻求 式 (12.2-51) rasta ze Pa BAY 
最 小 值 的 方法 ， 来 调整 每 层 的 权重 。 像 前 面 那样 ， 与 误差 关于 权重 的 偏 导数 成 比例 地 调整 权重 ， 可 实 
现 这 一 目的 。 换 句 话说 ， 


Aw, =-a—= (12.2-52) 


其 中 , 层 P 先 于 层 O, Awa, Wisk (12.2-42) 定义 的 那样 ，c 是 一 个 正 的 修正 增 量 。 
误差 Bo 是 输出 O 的 函数 ,而 O 是 输入 石 的 函数 。 使 用 链 式 法 则 , 我 们 计算 出 Eo 的 偏 导 数 如 下 : 
ago Eo OE, 








= (12.2-53) 
OW, ol, Ow 
由 式 (12.2-48) 可 得 
2S ny 0, =O, (12.2-54) 
Ow p=! 
将 式 (12.2-53) 和 式 (12.2-54) 代 入 式 basket ， 得 到 
OE 
AW» = 0 =a6,0, (12.2-55) 
q 
式 中 ， 
i -Zg (17.2-56) 


为 计算 偏 导数 8 Eo /6 1,， 根 据 Eo 相对 于 O, 的 变化 率 和 0, 相对 于 LRR, 我 们 使 用 链 式 法 
则 表示 偏 导数 ， 即 


ge eee (12.2-57) 
后 本 60, al, 
由 式 (12.2-51) 得 到 
OE 
20, =-(r, -0,) (12.2-58) 
而 由 式 (12.2-49) 得 到 
90, _ se J=) (12.2-59) 
ary ae 


将 式 (12.2-58) MII (12.2-59) FEA sk (12.2-57) 得 到 
ô, =(r, —O, hi (1,) (12.2-60) 
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它 与 误差 值 (一 Oy) 成 正比 。 将 式 (12.2-56) 到 式 (12.2-58) 代入 式 (12.2-55) ， 最 终 得 到 
Awp =a(r, —O, hi (I, )O, =a6,0, (12.2-61) 
指定 了 图 数 ia) 后 ， 式 \12.2-61) 中 的 所 有 项 都 是 已 知 的 ， BAT LEZ PUES, Hea, 
根据 对 网 络 输入 的 任何 训练 模式 的 表示 ， 我 们 就 知道 每 个 输出 节点 的 期 望 响 应 应 是 什么 。 就 像 层 O 
的 激活 元 素 的 输入 石和 层 己 中 节点 的 输出 0, 那 样 ， 每 个 输出 节点 的 值 O, 是 可 观察 到 的 。 这 样 ， 我们 
就 知道 如 何 调整 权重 ， 从 而 改进 网 络 中 最 后 一 层 和 上 一 层 之 间 的 链接 。 
将 输出 层 放 到 一 边 ， 我 们 现在 分 析 层 己 中 发 生 的 情况 。 采 用 与 上 面相 同 的 方式 ， 可 得 
Aw,, = ar, —O,)h, (1,)O, = 05,0, (12.2-62) 
其 中 误差 项 是 
6, =(r, -O,)h,U,) (12.2-63) 
除了 户外 , IR (12.2-62) 和 式 (12.2-63) 中 的 所 有 项 要 么 是 已 知 的 , 要 么 可 在 网 络 中 观察 到 。 在 内 部 层 
中 项 没有 意义 ， 因为 根据 模式 成 员 我 们 确实 不 知道 一 个 内 部 节点 的 响应 是 什么 。 仅 在 模式 分 类 最 终 发 
生 的 网 络 的 输出 处 ， 才 能 指定 想 要 的 响应 r。 如 果 知 道内 部 节点 的 信息 ， 就 不 需要 更 多 的 层 。 因 此 , 我 
们 必须 根据 已 知 的 或 可 在 网 络 中 观察 到 的 量 来 找到 重新 定义 d, 的 一 种 方法 。 
回 到 式 (12.2-57) ， 我 们 将 层 P 的 误差 项 写 为 
Ne (12.2-64) 
aI, 00, ôE, 
项 8 0,/67 不 难 表示 ， 如 先前 那样 ， 它 是 
ôO, eh, (I,,) 
一 旦 确定 了 h,， 上 式 就 是 已 知 的 ， 因 为 可 通过 观察 得 到 。 产 生 的 r HE FAO E,/0 0,， 所 以 该 项 
必须 以 不 包含 ,的 方式 来 表示 。 使 用 链 式 法 则 ， 我 们 将 偏 导数 写 为 


No ol No Np No No 
-r -> os ¥( St) 2S n90, 和 S-a) Wap = IAA (12.2-66) 
00, Sa, 60, (al, 0O, | a. a 


其 中 最 后 一 步 来 自 式 (12.2-56) 。 将 式 (12.2-65) 和 式 (12.2-66) FLASK (12.2-64) , 得 到 期 望 的 2 表达 式 为 





=-h, (1,) (12.2-65) 





No 
6, =hi,(1,) > 5,Wyp (12.2-67) 
q=l 


现在 可 以 计算 出 参量 5, ， 因 为 其 所 有 项 都 是 已 知 的 。 这 样 ， 式 (12.2-62) 和 式 (12.2-67) 就 完全 为 
层 已 建立 了 训练 规则 。 式 (12.2-67) 的 重要 性 是 由 量 56, 和 wm 来 计算 5,, 而 这 两 个 量 是 在 紧邻 层 P 
的 层 中 计算 出 来 的 项 。 计算 出 层 P 的 误差 项 和 权重 后 , 这 些 量 可 类 似 地 用 于 计算 紧邻 层 卫 之 前 的 
层 的 误差 项 和 权重 。 换 句 话 说 ,我们 找到 了 一 种 从 输出 层 的 误差 开始 ,将 误差 反 向 传播 回 网 络 的 
方法 。 
我 们 可 将 训练 过 程 总 结 并 归纳 如 下 。 对 于 任何 层 和 .其 中 层 K 是 紧邻 层 7 的 前 一 层 ,计算 权 
E wx， 该 权重 使 用 下 式 修改 这 两 层 之 间 的 连接 : 
Aw = 06,0. (12.2-68) 





如 果 层 .7 是 输出 层 ， 则 5 为 sie 
5, =(r,-O;)hi(1;) (12.2-69) |o17 


917 
919 
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如 果 层 7 是 一 个 内 部 层 ， 且 层 P 是 它 的 下 一 层 ( 右 侧 ) ， 则 5; 为 


Np 
ô; = 天 CO) > ôW (12.2-70) 


p=! 


其 中 j= 1, 2,…, Ny。 使 用 式 (12.2-50) 中 的 激活 函数 并 今 9,= 1， 可 得 


hi(I;)=0,0-O,) (12.2-71) 
在 这 种 情况 下 ， 式 (12.2-69) 和 式 (12.2-70) 采 用 特别 有 吸引 力 的 形式 ， 即 对 于 输出 层 有 
ô, =(r,-0,)0,(1-O,) (12.2-72) 
而 对 于 内 部 层 有 
N, 
ô, =0,(1-0,)) 5,w, (12.2-73) 
p=l 


在 式 (12.2-72) 和 式 (12.2-73) 中 ,都 有 j= 1,2,…, Nj。 

式 (12.2-68) 到 式 (12.2-70) 组 成 了 图 12.16 中 多 层 前 馈 神 经 网 络 的 一 般 delta 训练 法 则 。 该 处 理由 整 
个 网 络 的 任意 一 组 (都 不 相等 的 ) 权 重 开始 ,。 然后 , 在 任意 迭代 步 又 中 应 用 这 个 一 般 delta 法 则 包括 两 个 
基本 阶段 。 在 第 一 个 阶段 ， 为 网 络 提供 一 个 训练 向 量 ， 通 过 允许 该 向 量 在 各 个 层 中 传播 来 计算 出 每 个 
节点 的 输出 0, 。 然 后 , 将 输出 层 中 各 个 节点 的 输出 0; 与 它们 的 期 望 响应 六 进行 比较 , 生成 误差 项 6,。 
第 二 阶段 包括 一 条 通过 网 络 的 反 向 路 径 ， 在 此 期 间 ， 合 适 的 误差 信号 被 传递 给 每 个 节点 ， 并 做 相应 的 
权重 变化 。 这 一 过 程 同样 适用 于 偏 置 权重 @。 如 前 面 详 细 讨 论 的 那样 ， 这 些 权重 被 简单 地 当 作 额外 的 
权重 来 处 理 ， 它 们 把 一 个 单元 输入 修改 为 网 络 中 每 个 节点 的 求 和 连接 。 

通常 的 做 法 是 ， 和 追踪 该 网 络 误差 以 及 与 各 个 模式 相关 联 的 误差 。 在 成 功 的 训练 会 话 中 ， 网 络 误差 
会 随 迭 代 次 数 的 增加 而 减 小 ， 并 且 该 过 程 会 收敛 到 一 个 稳定 的 权重 集合 ， 对 于 附加 的 训练 ， 这 些 权 重 
仅 表 现 为 很 小 的 波动 。 紧 随 着 在 训练 期 间 完成 的 -个 模 5 "是否 被 正确 分 尖 的 方法 是 ， 从 得 到 的 模式 确 
定 输出 层 的 响应 ， 如 以 前 定义 的 那样 ， 与 模式 类 有 关 的 输出 层 节 点 的 响应 为 高 ， 所 有 其 他 节点 的 输出 
为 低 。 

系统 被 训练 之 后 ， 就 会 使 用 训练 阶段 中 建立 的 参数 来 对 模式 进行 分 类 。 在 正常 操作 中 ， 所 有 的 反 
馈 路 径 是 被 分 开 的 。 然 后 ， 人 允许 任何 输入 模式 传 过 不 同 的 层 ， 且 该 模式 被 分 类 为 属于 具有 高 值 输出 节 
点 的 类 ， 此 时 ， 其 他 所 有 节点 输出 为 低 。 如 果 被 标记 为 高 的 节点 不 止 一 个 ， 或 没有 节点 输出 被 标记 为 
高 ， 则 将 其 声明 为 一 个 错误 分 类 ， 或 简单 地 将 该 模式 赋 给 具有 最 高 数值 的 输出 节点 的 类 。 


” 例 12.6 使 用 神经 网 络 的 形状 分 类 。 

我 们 更 丰 说明 如 何 训 练 一 个 如 图 12.16 HERESIES, WIRE 12:18 “PBFA 4 AEA 
以 及 图 12.18(b) 中 所 示 的 这 4 种 形状 的 带 有 噪声 形式 的 样本 。 

Hih 这 些 形状 的 归 一 化 信号 ( 见 11.1.3 4) 产生 模式 向 量 ， 然后 得 到 每 个 信号 的 48 Assert 
EE 将 得 到 的 48 维 向 量 作为 图 12.19 所 示 的 三 层 前 人 神经 网 络 的 输入 。 第 一 层 中 神经 元 节点 数 选择 为 48, 
它 对 应 于 输入 模式 向 量 的 维 数 。 第 三 层 (输出 层 ) 中 的 4 个 神经 元 对 应 于 模式 类 的 数量 ， 而 中 间 层 的 神经 元 
的 数量 指定 为 26( 输 入 层 和 输出 层 中 的 神经 元 的 平均 数 ) 。 由 于 不 知道 确定 神经 网 络 内 部 层 的 节点 数 的 规 

则 ， 因此 该 数量 通常 要 么 基于 先 验 知识 ， 要 么 简单 地 任意 选择 ， 然 后 通过 测试 来 完善 。 在 输出 层 中， 从 
上 到 下 的 4 个 节点 此 时 分 别 代表 类 wj = 1, 2,3, 4. 在 设 定 网 络 结构 后 ， 必须 为 每 个 单元 和 层 选 定 激活 函 
数 。 根据 前 面 的 讨论 ， 人 2-50) ， ed a=) 以 便 可 以 应 用 式 (12 2-72) 
和 式 (12.2-73)。 





AAAA 
h 4 t | 


图 12.18 训练 图 12.19 中 的 神经 网 络 时 使 用 的 (a) 参考 图 形 和 (b) 典型 带 噪 
声 图 形 ( 图 像 由 南 伊利 诺 依 大 学 ECE 系 的 Lalit Gupta 博士 提供 ) 
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Bo (输出 层 ) 
No=4 


层 4 
Na=48 


图 12.19 用 于 识别 图 12.18 中 所 示 形 状 的 三 层 神 经 网 络 (图 像 由 南 伊利 诺 伊 大 学 ECE 系 的 Lalit Gupta 博士 提供 ) 
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训练 过 程 分 为 两 部 分 。 在 第 一 部 分 中 ， 权 重 被 初始 化 为 均值 为 零 的 小 随机 值 ， 然 后 使 用 与 类 似 于 
图 12.18(a) 中 相应 的 无 噪声 样本 的 模式 向 量 对 网 络 进行 训练 。 输出 节点 在 训练 期 间 是 受到 监控 的 。 对 于 来 
自 类 必 的 任何 训练 模式 , 车 输出 层 的 元 素 在 g=1,2,…, No 且 gxi 时 ， 产生 输出 值 0, > 0.95 和 0, <0.05, 
那么 我 们 说 网 ai 有 4 个 类 学 到 了 这 些 形状 。 换 句 话说， 对 类 人 的 任何 模式 ， 对 应 于 该 类 的 输出 单元 
必须 为 高 值 (>0.95) ， 同 时 所 有 其 他 节点 的 输出 必须 为 低 值 (<0.05) 。 

训练 的 第 二 部 分 是 对 噪声 样本 进行 训练, 产生 如 下 结果 。 在 无 噪声 的 图 形 中 ， PAATENEN LI 
素 被 赋予 一 个 保留 在 图 像 平 面 上 的 原始 坐标 的 概率 V, 而 其 8 BURR IAS hr BEL FAK R = 
1-V. wh VEHKA R), 则 噪声 的 程度 会 增加 。 这 样 就 生成 了 两 个 噪声 数据 集 。 第 一 个 噪声 集 由 每 个 类 
的 100 个 噪声 模式 组 成 ， 这 些 模式 是 RR 在 0.1 到 0.6 E 因此 共产 生 了 400 个 模式 。 该 集 
合 称 为 测试 集 ， a 

















人 习 序列 。 B R= O ERRI, BIRERE 
- es ee es sae 20 中 


- i -0 生成 的 数据 学 习 到 的 权重 向 量 开始 使 用 由 R; = 0.1 生成 的 噪声 数据 集合 对 系 
M EKERI REENE OEE I 试 样本 ， 建 立 识别 性 能 。 注 意 ， 系 统 在 性 能 
上 的 显著 改进 。 图 12.20 显示 了 R,= 0.2, 0.3 和 0.4 时 ， 继 续 这 种 再 训练 和 再 测试 过 程 得 到 的 结果 。 如 期 望 
的 那样 ， 如 果 系 统 学 习 正确 ， 则 由 该 测试 数据 集 错误 分 类 的 概率 会 随 RR, 的 增 大 而 降低 ， 因 为 系统 使 用 了 具 
有 较 高 R, 值 的 噪声 数据 进行 训练 。 图 12.20 中 的 一 个 例外 是 及 = 0.4 时 的 结果 。 原 因 是 用 于 训练 该 系统 的 
样本 数 较 少 。 也 就 是 说 ， 网 络 无 法 在 使 用 这 样 少 的 样本 的 情况 下 ， 使 自身 充分 适应 具有 更 高 噪声 水 平 的 形 
状 的 较 大 变化 。 这 一 假设 在 图 12.21 中 得 到 了 证 实 ， 该 图 表明 随 着 训练 样本 数 的 增加 ， 错误 分 类 的 概率 会 
随 着 降低 。 图 1221 还 显示 了 来 自 图 12.20 中 的 R=03 时 的 曲线 ， 它 仅 作为 参考 。 
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错误 分 类 的 概率 
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图 12.20 神经 网 络 的 性 能 是 噪声 水 平 的 函数 ( 原 图 由 南 伊利 诺 伊 大 学 ECE 系 的 Lalit Gupta 博士 提供 ) 
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0.000 
0.00 0.20 0.40 0.60 0.80 
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图 12.21 增加 训练 模式 的 数量 时 ，R, = 0.4 时 的 性 能 改进 (R, = 0.3 时 的 曲线 仅 
作为 参考 ) ( 原 图 由 南 伊利 诺 伊 大 学 ECE 系 的 Lalit Gupta 博士 提供 ) 


前 述 结果 表明 ， 三 层 神经 网 络 经 过 适当 水 平 的 训练 后 , 具有 学 习 识别 被 噪声 污染 的 形状 能 力 。 甚 至 当 
使 用 无 噪声 数据 (图 12.20 中 R,= 0) 训练 时 ， 使 用 被 噪声 高 度 污染 的 数据 (图 12.20 + R= 0.6) 进行 测试 ， 
系统 也 能 实现 接近 77% 的 正确 识别 水 平 。 当 系统 使 用 噪声 水 平 更 高 的 数据 (R, = 0.3 ALR = 0.4) 训练 后 ， 
对 相同 数据 的 识别 率 增加 到 99%。 注 意 ， 系 统 地 、 小 量 地 增 大 附加 噪声 来 训练 系统 ， 丰 可 增 大 系统 的 分 类 
能 力 ， 这 一 点 很 重要 。 已 知 噪声 的 性 质 时 ， te oe Sot cies 
很 理想 的 。 


决策 面 的 复杂 性 ， 我 们 已 经 证 明 一 个 单 层 感知 机 可 实现 一 个 超 平面 决策 而 。 此 时 ， 一 个 很 自然 
的 问题 是 : 由 图 12.16 中 模型 的 一 个 多 层 网 络 实现 的 决策 面 的 性 质 是 什么 ”下 面 讨论 一 个 三 层 网 络 能 
实现 由 相交 的 超 平面 组 成 的 任意 复杂 的 决策 面 ， 由 此 说 明 前 述 的 问题 。 

首先 ， 考虑 图 12.22 (a) 中 的 一 个 双 输 入 的 双 层 网 络 。 由 于 有 两 个 输入 ， 故 这 些 模 式 是 二 维 的 ， 从 

而 网 络 的 第 一 层 中 的 每 个 节点 在 二 维 空间 中 实现 一 条 直线 。 我 们 分 别 用 1 和 0 来 表示 这 两 个 节点 的 高 

输出 和 低 输出 。 假 设 输出 1 指出 对 应 于 第 一 层 中 的 一 个 节点 的 输入 向 量 位 于 该 直线 的 正 侧 。 那 么 馈送 
到 第 二 层 中 的 单个 节点 的 可 能 输出 组 合 是 (1, 1), (1, 0), (0, DACO, 0)。 如 果 定 义 两 个 区 域 , 一 个 区 域 对 应 
”于 类 oom， 位 于 两 条 直线 的 正 侧 ; 男 一 个 区 域 对 应 于 类 ww,， 位 于 两 条 直线 的 男 一 侧 ， 通 过 简单 地 执行 逻 
辑 “ 与 ”操作 ， 输 出 节点 就 可 以 把 任何 输入 模式 分 类 为 属于 这 两 个 区 域 之 一 。 换 句 话 说 ， 仅 当 来 自 
第 一 层 的 两 个 输出 都 为 1 时， 输出 节点 的 响应 才 为 表示 类 oi 的 1。 如 果 6 的 值 位 于 半 开 区 间 (1, 2]， 
那么 “与 ”操作 可 以 由 先前 讨论 的 神经 节点 的 形式 来 执行 。 这 样 ， 如 果 假 设 第 一 层 的 响应 为 0 和 1, 
那么 只 有 在 来 自 第 一 层 的 该 神经 节点 上 执行 的 求 和 大 于 1 时 ,输出 节点 的 响应 才 是 表示 类 ow 的 高 值 。 
图 12.22 (b) 和 (c) 显示 了 图 12.22 (a) 所 示 的 网 络 是 如 何 成 功 地 等 分 这 两 个 模式 类 的 ， 而 使 用 单个 线性 面 
则 做 不 到 这 一 点 。 
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如 果 第 一 层 中 的 节点 数 增加 到 三 个 , 那么 图 12.22 (a) 中 的 网 络 将 可 实现 由 三 条 直线 相交 组 成 的 一 
个 决策 边界 。 类 ow 位 于 所 有 三 条 直线 的 正 侧 这 一 要 求 , 将 生成 由 这 三 条 直线 围 成 的 一 个 凸 形 区 域 。 
事实 上 ， 任 何 开放 的 或 闭合 的 凸 区 域 ， 都 可 以 简单 地 通过 增加 两 层 神经 网 络 的 第 一 层 的 节点 数 来 
构造 。 


abe 


Xl 


x2 





图 12.22 ”〈a) 一 个 双 输 入 双 层 前 馈 神 经 网 络 ; (b) 和 (c) 可 使 用 该 网 络 实现 的 决策 边界 示例 


下 一 个 逻辑 步 又 是 将 层 数 增加 到 三 层 。 像 之 前 那样 ， 此 时 第 一 层 中 的 节点 实现 一 条 直线 。 为 形成 
由 各 条 直线 围 成 的 区 域 ,第 二 层 的 节点 执行 “与 ”操作 。 第 三 层 的 节点 将 不 同 的 类 划 归 不 同 区 域 。 例 
如 , 假设 ow 由 两 个 不 同 的 区 域 组 成 ， 每 个 区 域 由 不 同 的 一 组 直线 围 成 边界 ， 那 么 第 二 层 中 的 两 个 节点 
用 于 对 应 于 同一 模式 类 的 区 域 。 当 第 二 层 中 的 两 个 节点 之 一 变 为 高 值 时 ， 输 出 节点 之 一 应 该 能 够 提示 
该 类 的 存在 。 假 设 第 二 层 中 的 高 和 低 状 态 分 别 表 示 为 1 和 0， 那么 让 网 络 的 输出 节点 执行 逻辑 “或 ” 
操作 ， 可 得 到 这 种 能 力 。 根 据 前 面 讨 论 的 神经 节点 的 形式 , 我 们 可 通过 将 0 的 值 设置 在 半 开 区 间 [0, 1) 
内 来 这 样 做 。 然 后 ， 只 要 第 二 层 中 至 少 有 一 个 节点 与 变 为 高 值 (输出 为 1) 的 输出 节点 相关 联 ， 输 出 层 
中 的 相应 节点 也 将 变 为 高 值 ， 从 而 将 该 模式 分 配给 与 该 节点 相关 联 的 类 。 

图 12.23 总 结 了 前 面 的 讨论 。 注意 , 在 第 三 行 中 , 由 三 层 网 络 实现 的 决策 区 域 的 复杂 性 在 原理 上 是 
任意 的 。 实 际 上 ， 在 构造 可 正确 响应 与 特殊 类 相关 联 的 各 种 组 合 的 第 二 层 时 ， 通 常会 很 困难 。 原 因 是 
直线 不 会 刚好 截止 于 与 其 他 直线 的 交点 处 ， 从 而 同一 类 的 模式 可 能 会 出 现在 该 模式 空间 中 的 直线 的 两 
侧 。 实 际 上 ， 对 于 一 个 给 定 的 模式 类 ， 第 二 层 可 能 很 难 断 定 哪些 直线 应 该 包含 在 “与 ”操作 中 ， 或 许 
根本 上 就 不 可 能 。 参 考 图 12.23 的 第 三 列 中 的 “ 异 或 ”问题 表明 ， 如 果 输 入 模式 是 二 元 形式 的 ， 那 么 在 
两 个 维度 的 情形 下 只 能 构建 4 个 不 同 的 模式 。 如 果 模 式 按 如 下 方式 排列 : 类 m 由 模式 {(0, 1), (1, 0)} 组 
成 ,类 ow 由 模式 {(0, 0), (1, 1)} 组 成 ,那么 这 两 个 类 中 模式 类 的 归属 由 “ 异 或 ”(XOR) 逻辑 函数 给 出 ， 
仅 当 两 个 变量 中 的 一 个 或 另 一 个 为 1 时 ， 该 函数 值 才 为 1， 而 其 他 情形 下 它 为 0。 因此，XOR 函数 值 
为 1 指出 模式 属于 类 办 ， 而 XOR 函数 值 为 0 指出 模式 属于 mwn。 

前 面 的 讨论 可 以 直接 推广 到 款 维 情形 ， 此 时 我 们 使 用 超 平面 来 蔡 代 直线 。 单 层 网 络 实现 单个 超 平 
面 。 两 层 网 络 实现 由 超 平面 的 交集 组 成 的 任意 凸 形 区 域 。 三 层 网 络 实现 任意 复杂 度 的 决策 面 。 每 层 中 
使 用 的 节点 数 决定 了 后 两 种 情形 的 复杂 度 。 在 第 一 种 情形 下 ， 类 的 数量 限制 为 两 个 。 在 其 他 两 种 情形 
下 ， 类 的 数量 是 任意 的 ， 因 为 可 以 根据 手边 的 问题 来 选择 输出 节点 的 数量 。 

考虑 前 述说 明 ， 一 个 合乎 逻辑 的 问题 是 ， 为 什么 人 们 对 研究 三 层 以 上 的 神经 网 络 感 兴趣 ”毕竟 三 
层 网 络 就 可 以 实现 任意 复杂 度 的 决策 面 。 答案 在 于 仅 使 用 三 层 来 训练 网 络 的 方法 。 用 于 图 12.16 中 网 络 
的 训练 规则 可 使 误差 最 小 ， 但 未 说 明 如 何 将 一 组 超 平 面 与 之 前 讨论 的 三 层 网 络 的 第 二 层 中 的 节点 关联 

923) 起 来 。 事实 上 ,如 何在 层次 数 和 每 层 中 的 节点 数 之 间 进 行 折 中 分 析 这 一 问题 , 仍 有 待 解决 。 在 实际 中 ， 
924| 通常 通过 试 错 法 或 给 定 的 问题 域 的 已 有 经 验 来 解决 分 析 中 的 问题 。 






第 12 章 目标 识别 585 


决策 区 域 的 类 型 XOR 问 题 的 解 | 带 有 网 状 区 域 的 类 | 常用 决策 面 形状 


A on ! | A 


开放 的 或 闭合 
的 凸 形 区 域 
=B 


任意 (由 节点 数 
限制 的 复杂 性 





图 12.23 可 以 由 单 层 和 多 层 前 馈 网 络 带 有 一 层 或 两 层 隐藏 单元 与 
两 个 输入 形成 的 决策 区 域 的 类 型 ( 原 图 由 Lippman 提供 ) 


12.3 ”结构 方法 


12.2 节 中 讨论 的 技术 可 定量 地 处 理 模式 ， 并 且 大 部 分 忽略 了 模式 形状 中 固有 的 结构 关系 。 然 而 ， 
本 节 中 讨论 的 结构 方法 可 通过 精确 地 运用 这 些 类 型 的 关系 来 实现 模式 识别 的 目的 。 本 节 介 绍 两 种 基本 
的 基于 串 表 示 的 边界 形状 的 识别 方法 ， 串 是 结构 模式 识别 中 最 实用 的 方法 。 


12.3.1 匹配 形状 数 


为 了 比较 根据 形状 数 描述 的 区 域 边界 , 我 们 可 以 明确 表达 一 个 过 程 ， 该 过 程 类 似 于 12.2.1 节 中 为 模式 
向 量 引 入 的 最 小 距离 概念 。 参 考 11.2.2 节 中 的 讨论 可 知 ， 两 个 区 域 边界 (形状 ) 之 间 的 相似 度 定 义 为 它们 
的 形状 数 仍 保持 一 致 的 最 大 阶 。 例 如 , 令 a 和 4b 代表 由 4 方向 链 码 表示 的 闭合 边界 的 形状 数 。 如 果 

s;(a)=s;(b), j=4,6,8,-…,k 
s(a) #5(b),  f=k+2,k+4,~ 
那么 这 两 个 形状 有 一 个 相似 度 k， 其 中 s 代表 形状 数 ， 下 标 代 表 阶 。 两 个 形状 a FI b 之 间 的 距离 定义 
为 它们 的 相似 度 的 倒数 : 
D(a,b) =- (12.3-2) 


(该 距离 满足 如 下 性 质 : 


(12.3-1) 


D(a,b) >0 
D(a,b)=0,iff a=b (12.3-3) 
D(a,c) < max[(D(a, b), D(b, c)] 


k 或 思 都 可 以 用 于 比较 这 两 个 形状 。 如 果 使 用 相似 度 ， 则 越 大 ,形状 就 越 相 似 (注意 ,对 于 相同 的 形 区 4 
R, 为 无 穷 大 ) 。 使 用 距离 测度 时 ， 情 形 正 好 相反 。 ig 
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a d C f b e 
12.24 ” (a) 各 种 形状 ; (b) 假想 的 相似 树 ; (c) 相似 性 矩阵 ( 原 图 由 Bribiesca and Guzman 提供 ) 
12.3.2 $mi 


假设 两 个 区 域 边界 a 和 bb 已 被 编码 成 囊 ( 见 11.5 节 ) ， 两 个 串 分 别 表示 为 a1, tr, +++, an 和 bi, b,…, bmo 
令 o 表 示 两 个 串 之 间 的 匹配 数 ， 如 果 a, = Bk， 则 匹配 出 现在 第 个 位 置 。 不 匹配 的 符号 数 为 


B=max(|al,lb|)-a (12.3-4) 
式 中 ，|arg| 是 该 宗 量 的 串 表 示 的 长 度 ( 符 号 数 ) 。 可 以 证 明 ， 当 上 且 仅 当 a 和 4b 相同 时 p=0( 见 习题 12.21). 
a 和 45 间 一 种 简单 的 相似 性 测度 是 比率 
El ee 一 (12.3-5) 
B max(lal,bl)-a 
对 于 完美 匹配 ，R 为 无 限 大 ， 而 当 & Alb 中 没有 任何 符号 匹配 时 ，R 为 0U 比 时 = 0) 。 因 为 匹配 是 逐个 字 
符 进行 的 ， 对 于 降低 计算 量 来 说 ,每 条 边界 上 的 起 始点 就 很 重要 。 任 何 归 一 化 到 或 近似 归 一 化 到 相同 起 点 
pos] 的 方法 都 有 帮助 ， 只 要 它 与 强力 匹配 相 比 可 提供 计算 上 的 优势 ， 强 力 搜索 从 每 个 串 上 的 任意 点 开始 ,然后 
ad 移 位 一 个 字符 (采用 卷 绕 的 方式 ) 并 为 每 个 移 位 计算 式 (12.3-5) R 的 最 大 值 给 出 最 好 的 匹配 。 


R 
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例 12.8 ” 串 匹 配 示 例 。 

图 12.25 (a) 和 (b) 显示 了 来 自 两 个 目标 类 的 样本 边界 ， 它 们 由 一 个 多 边 形 拟 合 来 近似 ( 见 11.1.3 
节 ) 。 图 1225(c) 和 (分 别 显示 了 对 应 于 图 12.25 (a) 和 (b) 所 示 边 界 的 多 边 形 近 似 。 当 顺 时 针 追 踪 每 个 多 边 
形 时 ， 通 过 计算 各 线段 间 的 内 角 9， 就 形成 了 来 自 这 些 多 边 形 的 串 。 这 些 角 度 被 编码 成 8 个 可 能 的 符号 ， 
角度 增 量 为 45°， 即 :0%50 <45°, a: 45°<@ <90°, ontSo< Or <360°, 













3 142 oo 
10.3 84 23.7 








图 12.25 (a) l(b) 两 个 不 同 目标 类 的 样本 边界 ; (c) 和 (d) 对 应 的 
多 边 形 近似 ; (e)~(g)R 值 表 ( 原 图 由 Sze 和 Yang 提供 ) 


图 12.25 (e) 显示 了 针对 目标 1 本 身 的 6 个 样本 来 计算 测度 R 的 结果 。 例 如 ， 对 应 于 各 个 R 值 ， 符 号 
1.c 指 的 是 目标 类 1 的 第 三 个 串 。 图 12.25( 显示 了 第 二 个 目标 类 的 串 和 它们 自身 进行 比较 的 结果 。 最 后 ， 
图 12.25(g) 显示 了 通过 比较 一 个 类 的 串 与 其 他 类 的 串 得 到 的 尺 值 表 。 注意 ， 这 里 所 有 的 尺 值 比 前 两 个 表 中 
的 任何 项 都 小 ， 这 表明 及 测度 在 两 个 目标 类 间 的 辩 识 达到 了 很 高 的 程度 。 例 如 ， 如 果 串 1. 的 类 别 成 员 未 
知 ， 那 么 通过 将 该 串 和 类 1 的 样本 (原型 ) 串 相 比较 产生 的 最 小 及 值 将 是 47 [ 见 图 12.25(e) ]。 相 比 之 下 ， 
将 该 哩 和 类 别 2 的 串 相 比较 产生 的 最 大 值 将 是 124[ 见 图 1225 (8) T 由 此 可 得 出 如 下 结论 : 串 1a 是 目标 
类 1 的 成 员 。 这 种 分 类 方法 类 似 于 12.2.1 节 中 介绍 的 最 小 距离 分 类 器 。 





小 结 


从 第 9 章 开 始 ， 我 们 对 数字 图 像 处 理 的 论述 发 生 了 改变 ， 即 从 其 输出 为 图 像 的 处 理 变 为 1.1 
节 中 详细 说 明 的 其 输出 为 图 像 属性 的 处 理 。 尽 管 本 章 中 的 内 容 本 质 上 是 介绍 性 的 ， 但 所 覆盖 的 
主题 对 于 理解 目标 识别 技术 相当 基础 。 如 本 章 开 头 提 及 的 那样 ， 本 章 以 目标 的 识别 来 结束 合乎 
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逻辑 。 而 要 超越 这 一 点 ， 就 需要 1.4 节 中 提出 的 超出 范围 的 概念 。 准 确 地 说 ， 下 一 个 逻辑 步 又 是 开发 
图 像 分 析 方 法 ， 这 些 方法 的 正确 开发 要 求 有 来 自 于 机 器 智能 的 概念 。 

如 1.1 节 和 1.4 节 中 提 到 的 那样 ， 机 器 智能 及 其 相关 领域 ， 辟 如 场景 分 析 和 计算 机 视觉 ， 仍 处 于 
实际 发 展 的 早期 阶段 。 今 天 ， 图 像 分 析 问 题 的 求解 仍然 具有 启发 式 描述 的 特征 。 尽 管 这 些 方法 确实 发 
生 了 变化 ,但 它们 的 共同 基础 恰好 是 本 书 所 覆盖 的 内 容 。 

在 学 习 了 前 12 章 的 内 容 后 ,无 论 是 从 理论 角度 还 是 从 实践 角度 ， 读 者 现在 都 应 能 理解 数字 图 像 
处 理 所 跨 越 的 主要 领域 。 请 读者 对 所 有 的 讨论 细 加 琢磨 ， 以 便 为 以 后 深入 研究 该 领域 或 以 此 为 基础 的 
相关 领域 打下 坚实 的 基础 。 给 定 许多 特定 成 像 问题 的 性 质 后 ， 清 楚 地 理解 基本 原理 可 大 大 增加 成 功 解 . 
决 这 些 问 题 的 机 会 。 
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< 和 标 有 星 号 的 习题 的 详细 答案 ， 
可 在 本 书 的 网 站 上 找到 。 该 网 站 还 基 
于 本 章 的 内 容 给 出 了 建议 的 项 目 。 


习题 


12.1 (a) 对 图 12.1 中 所 示 的 模式 ， 计 算 最 小 距离 分 类 器 的 决策 函数 。 
通过 仔细 观察 ， 你 可 能 会 得 到 所 需 的 均值 向 量 。 
(b) Mit H (a) 中 决策 函数 实现 的 决策 面 。 
412.2 ”根据 模式 分 类 ,说明 式 (12.2-4) 和 式 (12.2-5) 的 功能 相同 。 
12.3 证 明 由 式 (12.2-6) 给 出 的 面 是 连接 维 点 同和 三 的 直线 的 垂直 平分 线 。 
六 12.4 联系 对 图 12.7 的 讨论 ， 说 明 最 小 距离 分 类 器 是 如 何 使 用 丈 组 
电阻 (W 为 类 别 的 数量 ) ， 在 每 组 处 做 求 和 连接 (对 电流 求 和 ) 
和 一 个 可 选取 WW 个 输入 中 最 大 输入 的 最 大 选择 器 来 实现 的 ， 
这 里 输入 为 电流 。 
12.5 证 明 式 (12.2-8) 的 相关 系数 的 值 域 为 [一 1, 1]。[ 提示 :以 向 量 形 
式 表 示 Wx, Vo | 
x126 某 实 验 产 生 了 斑点 的 二 值 图 像 ， 这 些 斑 点 的 形态 近似 为 椭圆 
( 见 右 图 ) 。 斑 点 有 三 种 尺寸 ， 这 些 椭圆 的 主轴 的 平均 值 为 (1.3， 
0.7), (1.0, 0.5), (0.75, 0.25)。 这 些 轴 的 尺寸 相对 于 它们 的 平均 值 
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Ai + 10% 的 变化 。 请 开发 一 个 图 像 处 理 系 统 ， 要 求 该 系统 能 够 拒绝 不 完整 的 或 相互 重 释 的 椭圆 ， 
然后 将 剩 下 的 单个 椭圆 分 类 到 给 定 的 三 种 尺寸 类 之 一 中 去 。 请 以 方 框图 的 形式 说 明 你 的 解决 方案 ， 
对 于 每 个 框图 的 操作 给 出 详尽 的 细节 。 使 用 最 小 距离 分 类 器 解决 分 类 问题 ,， 清 楚 地 指出 如 何 获得 
训练 样本 ， 以 及 如 何 使 用 这 些 样本 来 训练 分 类 器 。 
12.7 下 列 模式 类 具有 高 斯 概率 密度 函数 : co: {(0, 0)', (4, 0)', 4,4)", 0, Ao: (5, 5)", (7,5), (7.7). 5,7) Yo 
(a) 假设 Plo) = Plan) = 1/4, 请 给 出 这 两 个 类 间 的 贝 叶 斯 决策 边界 的 方程 。 
(b) 画 出 该 边界 。 
12.8 ”重复 习题 12.7, 但 使 用 下 列 模式 类 : co: {(— 1, 0)', 0,- 1)", (1, 0)", 0, D Ala: {(—4, 0)', (0,- 4)", 4, 07, 
(0, 4) }。 显 然 ， 这 些 类 不 是 线性 可 分 的 。 
12.9 重复 习题 12.6, 但 使 用 一 个 贝 叶 斯 分 类 器 (假设 其 是 高 斯 密度 分 布 的 ) 。 请 清楚 地 指出 你 是 如 何 得 
到 训练 样本 的 ， 以 及 你 是 如 何 使 用 这 些 样 本 来 训练 分 类 器 的 。 
1210 贝 叶 斯 决策 函数 d(x) =p(x/@)P(@),j=1,2,…, 画 是 使 用 一 个 0-1 损失 函数 推导 的 。 证 明 这 些 决 策 
函数 可 最 小 化 错误 分 类 的 概率 。[ 提示 : 错误 分 类 概率 p(e) 是 1 — p(c), 其 中 p(o) 是 正确 分 类 的 概率 。 
对 于 一 个 属于 类 的 模式 向 量 x 4 plex) = p(@/x)o 3K ple), 并 证 明 当 p(x/@3)P(@@) 是 最 大 值 时 Po) 
也 是 最 大 值 ( 而 p(e) 为 最 小 值 ) ]; 
12.11 (a) 对 下 列 模 式 类 应 用 感知 机 算法 : 四 : {(0, 0, 0), (1, 0, 07, (1, 0, 1)', (1, 1, 0)"} 和 @y: {(0, 0, 1)", (0, 1, DF, 
(0, 1,0)", (1, L 1)"}. 4 c=1 A w(1)=(—1,-1,-2, 0). 
(b) 画 出 (a) 中 得 到 的 决策 面 。 给 出 这 些 模 式 类 并 指出 该 决策 面 的 正 侧 。 
*12.12 将 类 ww 的 模式 乘 以 -1， 可 以 按 一 种 更 为 简洁 的 形式 来 表达 式 (12.2-34) 到 式 (12.2-36) 中 给 出 的 感 
知 机 算法 ; 此 时 ,算法 中 的 修正 步 又 变 为 : 若 wx(by(D> 0, 则 mk+D=mw, 否 则 mw(k+D=w 
+cy( 且 。 这 是 从 下 面 的 通用 梯度 下 降 公 式 开始 ， 推 导出 来 的 几 个 感知 机 算法 公式 之 一 : 


OJ(w,y) 
w(k +1) = w(k) e| w | 
其 中 c > 0, Aw, 力 是 一 个 准则 函数 ， 偏 导数 在 w= w( 妨 处 计算 。 证 明 使 用 准则 函数 Aw, y) = 
1/2(\w'y|— wy), 可 由 通用 梯度 下 降 过 程 得 到 该 感知 机 算法 公式 , 其 中 |arg| 是 宗 量 的 绝对 值 。( 注 意 : 
wy 关于 w 的 偏 导 数 等 于 y。) 
12.13 证明; 如果 训练 模式 集合 线性 可 分 ， 那么 式 (12.2-34) 到 式 (12.2-36) 中 给 出 的 感知 机 训练 算法 会 在 
有 限 步 内 收敛 | 提示 : 将 类 cw 的 模式 乘 以 一 1, 并 考虑 一 个 非 负 阔 值 7， 以 便 感知 机 训练 算法 (c = 
1) 可 表示 为 : H wyk > T, Wi w(k +1) = w(k) ; T w(k +1) = w(k) + y(k) 。 你 可 能 需要 用 到 
柯 西 - 施 瓦 芯 不 等 式 |a| bP > (ay 。] 
#1214 ”指定 一 个 神经 网 络 的 结构 和 权重 ， 该 神经 网 络 的 功能 完全 与 n 维 空间 中 两 个 模式 类 的 最 小 距离 分 
类 器 的 功能 相同 。 
1215 ”指定 一 个 神经 网 络 的 结构 和 权重 ， 该 神经 网 络 的 功能 完全 与 n 维 空间 中 两 个 模式 类 的 贝 叶 斯 分 类 
器 的 功能 相同 。 这 些 类 是 高 斯 型 的 ， 具 有 不 同 的 均值 ， 但 协 方差 矩阵 相等 。 
去 12.16 (a) 在 什么 条 件 下 ， 习 题 12.14 和 习题 12.15 中 的 神经 网 络 相同 ? 
(b) 如 果 使 用 足够 数量 的 样本 进行 训练 ,那么 用 于 12.2.3 节 中 讨论 的 多 层 前 馈 神经 网 络 的 通用 Dleta 
准则 会 生成 (a) 中 的 特殊 神经 网 络 吗 ? 
12.17 在 两 个 维度 上 的 两 个 模式 类 按 如 下 方式 分 布 : 类 mw 的 模式 沿 半径 为 的 一 个 圆 随机 分 布 。 类 似 地 ， 类 
an 的 模式 沿 半径 为 ,的 一 个 圆 随机 地 分 布 ， 其 中 =4r1。 为 正确 地 分 类 这 两 类 模式 ， 请 指定 一 个 = 
具有 最 少数 量 的 层 和 节点 的 神经 网 络 。 9 
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重复 习题 12.6， 但 使 用 一 个 神经 网 络 。 请 清楚 地 指出 如 何 得 到 训练 样本 ， 并 说 明 如 何 使 用 这 些 样 
本 来 训练 分 类 器 。 请 按 你 的 主张 选择 可 解决 该 问题 的 最 简 神 经 网 络 。 

证 明 式 (12.2-71) 中 给 出 的 表达 式 加 (1)= 0/1 一 0) 是 由 式 (12.2-50) 在 8,=1 时 推导 出 来 的 ， 其 中 
hy (I) =6 hy 6 Ge 

证 明 式 (12.3-2) 中 的 距离 测度 D(A, 8) 满足 式 (12.3-3) 给 出 的 性 质 。 

说 明 当 上 且 仅 当 a 和 好 是 相同 的 串 时 ， 式 (12.3-4) 中 的 = maxal, |b) — a 为 0。 

某 工 厂 为 运动 会 生产 美国 国旗 。 质 量 保证 小 组 发 现 ， 在 生产 高 峰 期 间 ， 某 些 印刷 机 器 有 (随机 地 ) 
少 印 1~3 颗 星 或 1 ~2 条 条 纹 的 倾向 。 除 了 这 些 错误 之 外 ， 在 其 他 方面 国旗 都 很 完美 。 尽 管 对 于 
全 部 产品 来 说 ， 含 有 错误 的 国旗 的 数量 很 少 ， 但 工厂 经 理 仍 决定 解决 该 问题 。 仔 细 研 究 后 ， 他 认 
为 使 用 图 像 处 理 技术 来 进行 自动 检测 是 解决 该 问题 的 最 经 济 方法 。 基 本 规格 如 下 : 国旗 大 小 约 
为 7.5cmx 12.5cm, 他 们 将 生产 线 的 纵向 移动 (独立 地 , 但 方向 上 有 士 10" 变 化 ) 速度 减 小 到 约 40 
cm/s， 国 旗 之 间 的 间隔 约 为 5 cm。 所 有 情形 下 ,“ 约 ”都 意味 着 土 5%。 假 设 工厂 经 理 雇用 你 为 生 
产 线 设 计 一 个 图 像 处 理 系 统 。 在 论证 方法 的 可 行 性 时 ， 你 被 告知 成 本 和 简单 性 是 很 重要 的 考虑 因 
素 。 请 基于 图 1.23 设计 一 个 完整 的 系统 。 将 你 的 解决 方案 (包括 各 种 假设 和 规格 ) 简单 (但 清楚 ) 地 
写成 文档 并 上 报 给 工厂 经 理 。 





本 附录 包含 了 CCITT Al JPEG 压缩 使 用 的 码 表 。 表 A.1 和 表 A.2 是 CCITT Group 3 和 CCITT 
Group 4 压缩 的 改进 霍 夫 曼 编 码 。 表 A.3 ER A.5 是 JPEG DCT 系数 的 编码 。 使 用 这 些 表 的 详细 信息 ， 
请 参阅 第 8 章 中 的 8.2.5 WA 8.2.8 节 。 


表 A.1 CCITT 终结 码 







0 00110101 0000110111 32 00011011 000001101010 
1 000111 010 33 00010010 000001101011 
2 0111 11 34 00010011 000011010010 
3 1000 10 35 00010100 000011010011 
4 1011 O11 36 00010101 000011010100 
5 1100 0011 37 00010110 000011010101 
6 1110 0010 38 00010111 000011010110 
7 1111 00011 39 00101000 000011010111 
8 10011 000101 40 00101001 000001101100 
9 10100 000100 41 00101010 000001101101 
10 00111 0000100 42 00101011 000011011010 
11 01000 0000101 43 00101100 000011011011 
12 001000 0000111 44 00101101 000001010100 
13 000011 00000100 45 00000100 000001010101 
14 110100 00000111 46 00000101 000001010110 
15 110101 000011000 47 00001010 000001010111 
16 101010 0000010111 48 00001011 000001100100 
17 101011 000001 1000 49 01010010 000001100101 
18 0100111 0000001000 50 01010011 000001010010 
19 0001100 00001100111 31 01010100 000001010011 
20 0001000 00001101000 52 01010101 000000100100 
21 0010111 00001101100 33. 00100100 000000110111 
22 0000011 00000110111 54 00100101 000000111000 
23 0000100 00000101000 55 01011000 000000100111 
24 0101000 00000010111 56 01011001 000000101000 
25 0101011 0000001 1000 57 01011010 000001011000 
26 0010011 000011001010 58 01011011 000001011001 


27 0100100 000011001011 59 01001010 000000101011 
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( 续 表 ) 

Se ë REBF ”行程 。” 白色 码 字 REMF 
0011000 000011001100 60 01001011 000000101100 
00000010 000011001101 — 61 00110010 000001011010 
00000011 000001101000 62 00110011 000001100110 
00011010 000001101001 63 00110100 000001100111 


表 A2 CCITT 补充 码 


0000001111 960) 011010100 0000001110011 






64 11011 


128 10010 000011001000 1024 011010101 0000001110100 
192 -010111 000011001001 1088 011010110 0000001110101 


256 0110111 000001011011 1152 011010111 0000001110110 
320 00110110 000000110011 1216 011011000 0000001110111 
384 00110111 000000110100 1280 011011001 0000001010010 
448 01100100 000000110101 1344 011011010 0000001010011 
512 01100101 0000001101100 1408 011011011 0000001010100 
576 01101000 0000001101101 1472 010011000 0000001010101 
640 01100111 0000001001010 1536 010011001 0000001011010 
704 011001100 0000001001011 1600 010011010 0000001011011 
768 011001101 0000001001100 1664 011000 0000001100100 
832 011010010 0000001001101 1728 010011011 0000001100101 
896 011010011 0000001110010 


码 字 码 字 

1792 00000001000 2240 000000010110 
1856 00000001100 2304 000000010111 
1920 00000001101 2368 000000011100 
1984 000000010010 2432 000000011101 
2048 000000010011 2496 000000011110 
2112 000000010100 2560 000000011111 
2176 000000010101 





#A3 JPEG 系数 编码 分 类 





0 

sa 1 

33725, 2,5 2 2 

=f, —4, 4, + 3 3 

15,28 +, 3 4 4 

a 16>", 31 5 5 
3 6 6 
7 |, 64, 64; °>*, 127 全 7 
—255, -*-, —128, 128, 255 8 8 
=511, *+-, —256;256, --+, SH 9 9 
1023, *= SL 512; + 1023 A A 
—2047, +: , —1024, 1024,---, 2047 B B 
—4095, +++, —2048, 2048. -- - , 4095 Cc Cc 
—8191,--- , —4096, 4096, --- , 8191 D D 
—16383, - +- , —8192, 8192, ---, 16383 E E 
—32767, +++. —16384, 16384, +--+, 32767 F N/A 


表 A.4 JPEG 默认 的 DC 编码 (照度 ) 





1110 10 


0 O10 3 6 

1 O11 4 7 11110 12 
2 100 5 8 111110 14 
3 OO 5 9 1111110 16 
4 101 WA A 11111110 18 
5 110 8 B 111111110 20 





行程 /类 别 


w/o 
0/1 
0/2 
0/3 
0/4 
O/S 
0/6 
0/7 
O/8 
0/9 
D/A 
1/1 
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RAS JPEG 默认 的 AC 编码 (照度 ) 


基 码 
1010 (= EOB) 
00 
01 
100 
1011 
11010 
111000 
1111000 
1111110110 
1111111110000010 
1111111110000011 
1100 
111001 
1111001 
111110110 
11111110110 
1111111110000100 
1111111110000101 
1111111110000110 
1111111110000111 
1111111110001000 
11011 
11111000 
1111110111 
1111111110001001 
1111111110001010 
1111111110001011 
1111111110001100 
1111111110001101 
1111111110001110 
1111111110001111 
111010 
111110111 
11111110111 
1111111110010000 
1111111110010001 
1111111110010010 
1111111110010011 
1111111110010100 
1111111110010101 
1111111110010110 
111011 
1111111000 
1111111110010111 
1111111110011000 
1111111110011001 
1111111110011010 
1111111110011011 
1111111110011100 
1111111110011101 
1111111110011110 
1111010 
1111111001 
1111111110011111 
1111111110100000 
1111111110100001 
1111111110100010 
1111111110100011 
1111111110100100 
1111111110100101 
1111111110100110 
1111011 


基 码 


11111010 
111111111000000 
1111111110110111 
1111111110111000 
1111111110111001 
1111111110111010 
1111111110111011 
1111111110111100 
1111111110111101 
1111111110111110 
111111000 
1111111110111111 
1111111111000000 
1111111111000001 
1111111111000010 
1111111111000011 
1111111111000100 
1111111111000101 
1111111111000110 
1111111111000111 
111111001 
1111111111001000 
1111111111001001 
1111111111001010 
1111111111001011 
1111111111001100 
1111111111001101 
1111111111001110 
1111111111001111 
1111111111010000 
111111010 
1111111111010001 
1111111111010010 
1111111111010011 
1111111111010100 
1111111111010101 
1111111111010110 
1111111111010111 
1111111111041000 
1111111111011001 
1111111010 
1111111111011010 
1111111111011011 
1111111111011100 
1111111111011101 
1111111111011110 
1111111111011111 


1111111111100000 > 


1111111111100001 
1111111111100010 
11111111010 
1111111111100011 
1111111111100100 
1111111111100101 
1111111111100110 
1111111111100111 
1111111111101000 
1111111111101001 
1111111111101010 
1111111111101011 
111111110110 


KE 


9 

17 
19 
20 
21 


25 
26 
13 
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11111111000 
1111111110100111 
1111111110101000 
1111111110101001 
1111111110101010 
1111111110101011 
1111111110101100 
1111111110101101 
1111111110101110 
11111001 
11111111001 
1111111110101111 
1111111110110000 
1111111110110001 
1111111110110010 
1111111110110011 
1111111110110100 
1111111110110101 
1111111110110110 


E/2 
E/3 
E/4 
E/5 
E/6 
E/7 
E/8 
E/9 
E/A 
F/0 
F/1 
F/2 
F/3 
F/4 
F/5 
F/6 
F/7 
FA 
F/9 
F/A 


1111111111101100 
1111111111101101 
1111111111101110 
1111111111101111 
1111111111110000 
1111111111110001 
1111111111110010 
1111111111110011 
1111111111110100 
111111110111 

1111111111110101 
1111111111110110 
1111111111110111 
1111111111111000 
1111111111111001 
1111111111111010 
1111111111111011 
1111111111111100 
1111111111111101 
1111111111111110 
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Coding 编码 488-495, 549, 550-552, 562, 564-636 见 
Compression 


methods for image compression ”图 像 压 缩 的 ~ 方法 562, 564-636 
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Color image processing ”彩色 图 像 处 理 416-482 
chromaticity diagram JEA] 421-422 
color corrections ”彩色 校正 455 
color “gradient” 彩色 梯度 471 
CMY model CMY 模型 424,428-429 
CMYK model CMYK 模型 424, 429 
colorslicing 彩色 分 层 ( 分 割 ) 453 
compression and 压缩 和 ~ 476-477 
edge detection ”边缘 检测 469 
full-color processing 全 彩色 处 理 416,446-448 
histogram processing ”直方 图 处 理 460 
HSI model HIS 模型 424,429-436 
intensity slicing KIESA 437 
intensity to color 灰 度 至 彩色 440 
models for ~ 的 模型 423-436 
noisei ~ 中 的 噪声 473-476 
pseudocolor 伪 彩 色 416, 436-446 
RGB model RGB 模型 423-424, 424-428 
segmentation ”分割 467-472 
sharpening (22) fitk 464465 
smoothing in ”~ 中 的 平滑 461-464 
transformations in ~ 中 的 变换 ”448-461 
trichromatic coefficients ”三 色 系数 421 
Color transformations ”彩色 变换 448-461 
color circle for 二 的 彩色 环 452 
color management systems (CMS) for ~ 的 彩色 管理 系统 
455-459 
complements ~ 的 补 色 ”452-453 


corrections to color and tone ~ 中 颜色 和 色调 的 校正 ”455-459 ， 


formulation for ”~ 的 公式 ”448-451 
histogram processing for ”~ 的 直方 图 处 理 460-461 
profiles for ~ 的 剖面 线 455-456 
slicing ~ 分 层 (分 割 ) 453-455 
tonal range for ~ 的 色调 范围 456-458 
Commission Internationale del’Eclairage (CIE) ”国际 照明 委员 会 
419, 421-422, 456 
Compact support ” 紧 支 撑 503 
Complex numbers 复数 ”224-225 
Compression 压缩 49,476-477, 547-648 
arithmetic coding 算术 编码 ~ 570-573 
bit-plane coding ”比特 平面 编码 ~ 584-588 
block transform coding 块 变换 编码 ~ 588-606 
BMP 位 图 (扩展 名 ) 576 
CCITT 577-581 
coding redundancy ”编码 元 余 ~ 549, 550-551 
~colorimages ”彩色 图 像 ~ 476-477 
containers for ”~ 的 容器 (存储 器 ) 560-562, 563 
fidelity criteria ”~ 的 保 真 度 准则 556-558 
formats for ”~ 的 格式 560-562, 563 
fundamentals of ~ 的 基础 ”548-562 
Golomb coding Golomb 编码 566-570 
Huffman coding EKSH 564-566 
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irrelevant information and 不 相关 的 信息 和 ~ 549, 552-553 theorem ”~ 定理 277 
JBIG-2 JBIG-2~ 583-588 Cross-modulation ”交叉 调制 492 
JPEG JPEG~ 601-606 CT 见 Computed tomography 
JPEG-2000 JPEG-2000~ 629-635 Cutoff frequency 截止 频率 292 
Lempel-Ziv-Welch (LZW) coding LZW 编码 573-575 
mapping and 映射 和 ~ 552, 559-560 D 
measuring information for ~ 的 度量 信息 553-556 Dam construction for watersheds ”分 水 岭 的 水 坝 构 建 ” 794-796 
methods of ~ 的 方法 562, 564-636 Data compression GEIE 548 Jil Compression 
models for ”~ 的 模型 558-560 Dead zones SEK 629 
MPEG-4 AVC (H.264) MPEG-4 AVC (H.264) ~ 616-618 Decimation 抽取 253 
predictive coding “预测 编码 ~ 606-625 Decision function ”决策 函数 888 
quantization and 量化 和 ~ 553, 559-560, 618-620, 624-625 Decision surfaces, complexity of 决策 面 ，~ 的 复杂 度 921-924 
ratio ~ 率 548-549 Decoding 解码 558, 560 
run-length coding 行程 编码 ~ 575-581 Huffman coding and ERSAM- 565 
spatial redundancy SEICA ~ 549, 551-552 image decompression and 图 像 解 压缩 和 ~ 558,560 
standards for ”~ 的 标准 560-562, 563 inverse mapper for ~ 的 反映 射 器 ”560 
symbol-based coding ”基于 符号 的 编码 ~ 581-584 symbol decoder for -~ 的 符号 解码 器 560 
temporal redundancy 时间 元 余 ~ 549, 551-552 Decomposition 分 解 537-540, 628-629 
wavelet coding ”小 波 编码 ~ 626-636 boundary segments from ~ 导致 的 边界 分 割 832-834 
0 of image processing system ”图 像 处 理 系统 的 组 成 level selection for wavelet coding ”小 波 编码 的 ~ 级 别 选 取 
628-629 
Computed tomography (CT) ”计算 机 断层 28, 33, 71,334, 384-409 trees in wavelet packets ”小 波 包 中 的 ~ 树 537-540 
Computerized axial tomography (CAT) “计算 机 轴 疝 断层 ” 见 wavelets and 小 波 和 ~ 537-540, 628-629 
Computed tomography Defense Meteorological Satellite Program (DMSP) ”国防 气象 卫星 计 
Connected component ”连通 分 量 划 37 
definition ~ 的 定义 91 Defuzzification ÆW 204-205, 207 
description ”~ 的 描述 845-849 Degradation 退化 见 Restoration 
extraction of “~ 的 提取 667—669, 707 estimating ”~ 估计 368-372 
segmentation ”~ 的 分 割 786,794 linear, position-invariant ”线性 位 ( 置 ) 不 变 ~ 365-368 
Connected pixels ”连通 像素 91 model of ~ 的 模型 334-335 
Connected set 连通 集 91 Delta modulation (DM) ”德尔 塔 ( 增 量 ) 调 制 619-620 
Constrained least squares filtering ”约束 最 小 平方 滤波 ”379-383 Denoising ÆW 334,530 
Containers for image compression ”图 像 压缩 的 存储 器 560-562, Derivative 导数 Jil Gradient, Laplacian 
563 first order 一 阶 ~ 180-182, 715 
Continuous wavelet transform (CWT) ”连续 小 波 变换 513-515 second order 二 阶 ~ 180-182,715 
scale and translation in ”~ 中 的 尺度 和 平移 513 Description 描述 837-877 
admissibility criterion ”容许 准则 513 area 面积 ~ 837 
Contour 轮廓 Jil Border, Boundary basic rectangle JAH ~ 837 
Contraharmonic mean filter Contraharmonic 均值 滤波 器 345-347 boundary 边界 ~ 837 
Contrast ”对比度 24, 80, 100, 119, 142, 208,869 JL Enhancement circularity ratio BE~ 844 
local 局 部 ~ 780 compactness ”致密 性 ~ 844 
medium 中 等 ~ 99, 139 diameter 直径 ~ 837 
measure of ~ 度量 850, 854-856 eccentricity 偏心 ~ 837 
simultaneous 瞬时 ~ 63 Euler number 欧 拉 数 = 845 
. stretching ”~ 拉 伸 ”128, 137, 138 Fourier descriptors (ANH ~ 840 
ntrol points ”控制 点 112 moment invariants pÆ ~ 861 
Convex hull fis perimeter 周 长 ~ 844 
definition ~ 的 定义 669 principal components ” 主 成 分 ~ 864 
extraction ”~ 的 提取 669-671 regional 区 域 ~ 见 Regional descriptors 
for description ”~ 的 描述 832-834 relational 关系 ~ 874 
Convex deficiency (hit 669 shape numbers 形状 数 ~ 838 
Convolution ” 卷 积 statistical moments iE ~ 843 
by digital filtering ”数字 滤波 ~ 489 texture 纹理 ~ 849-861 
circular 循环 ~ 245,271 topological 拓扑 ~ 845 
filter ~ 滤波 器 172 Denoising 去 噪 530 
integral 积分 ~ 367 Detail coefficients (horizontal, vertical, and diagonal) ”细节 系数 (水 
kernel ~ 核 172 E, HANAR) 494, 508,511 
mask ~ 模板 172 Differential pulse code modulation (DPCM) 差分 脉冲 编码 调制 
spatial continuous ”空间 连续 ~ 231-32, 433 ' 621-624 
spatial discrete ”空间 离散 ~ 168-172 Digital 数字 
theorem ”~ 定理 232, 271, 276, 285, 367, 401, 811, 892 filter ”~ 滤波 器 IL Filters 
Co-occurrence matrix ”共生 矩阵 852-858 image, definition of ~ FUR, ~ 图 像 的 定义 23 
Correlation ”相关 Digital image processing ”数字 图 像 处 理 ” 见 Image 
circular 循环 ~ 276 defined ”~ 的 定义 23-25 
coefficient ”~ 系数 642,892 fields of ~ 的 领域 29-47 
descriptor ~ {HtA 853,856 fundamentals of ”~ 基础 知识 、57-125 
matching by ~ 匹配 891-894 high-level processes of ~ 的 高 级 处 理 24 


spatial 空间 ~ 168-172 history of 一 的 历史 25-29 


origins of ~ 的 起 源 25-29 
sensors for ~ 的 传感器 50, 68-73 
steps in ~ 的 步骤 47-50 
Digital signal filtering ”数字 信号 滤波 488-491 
Digital signal processing (DSP) ”数字 信号 处 理 488-491 
Digital Video Disk (DVD) ”数字 视频 光盘 547-548 
Digitizer 数字 化 器 ”50, 70 
Dilation 膨胀 ” 见 Morphological image processing 
Dilation equation ”膨胀 公式 ”504 
Discrete cosine transform (DCT) ”离散 余弦 变换 591 见 JPEG 
compression 
Discrete Fourier transform (DFT) “离散 传 里 叶 变换 
averagevalue 平均 值 268,275 
circular convolution 循环 卷 积 JL Convolution 
circular correlation ”循环 相关 JL Correlation 
derivation of ~ 的 导数 ”224-235 
Fast Fourier Transform (FFT) ”快速 依 里 叶 变 换 321-325 
implementation ”~ 的 实现 320-325 
padding ”~ 的 填充 273-275 
pair, 1-D ~—HEX 258 
periodicity of ~ 的 周期 性 259-261 
phase angle ”~ 的 相 角 267,275 
polar representation ~ 极 坐 标 表示 ”275 
properties ”~ 属性 258-275 
separability ~ 的 可 分 离 性 276 
spectrum ”~ 谱 229,248, 267,275 
symmetry properties ~ 的 对 称 性 ”264 
two-dimensional 二 维 ~ -257-258 
zero padding ~ EHE 273-274 
wraparound error ”~ 的 缠绕 错误 ”272 
Discrete wavelet transform (DWT) ”离散 小 波 变 换 510-512, 524 
见 Wavelets 
Discriminant (decision) analysis ”判别 (决策 ) 分 析 884-885, 888 
Distance measures ”距离 度量 (测度 ) 93-94, 114-115, 467, 
784-785, 831, 837, 888-891, 899, 925 
Dots (pixels) 点 (像素 ) 
perinch (DPI) ”~ 每 英寸 81, 256, 581 
per unit distance ”~ 每 单位 距离 。81 
Downsampling 下 取 ( 采 ) 样 486-487 
DPI 点 每 英寸 81,256,581 
DV compression DV 压缩。 560, 562 
Dynamic range 动态 范围 79-80 


E 
Edge 边缘 见 Edge detection 
color 彩色 ~ 469-472 
definition ~ 的 定义 92 
direction ”~ 的 方向 728 
enhancement ”~ 增强 179-190, 302-311, 693 
gradient ~ 梯度 187,471, 623, 693, 728 
linking ~ 连接 747-760 
magnitude ”~ 幅度 187-188, 728 
map ~ 了 映射 733 
models ”~ 模型 722-728 
noise sensitivity ”~ 噪声 敏感 性 726-727 
normal ~ 法 线 729 
operators ”~ 算 子 730° 


ramp 斜坡 ~ 181,715,724 
roof 屋顶 ~ 715,724 
step 台阶 ~ 181,715,724 


types ~% 180-182,716 

unit normal 单位 法 线 ~ 729 

wavelet transform and ”小 波 变换 和 ~ 

zero crossing ”~ 零 交 义 181,725, 739 
Edge detection ”边缘 检测 469-472, 722-747 WL Edge 

boundary detection ”边界 检测 ”747 

Canny edge detector 坎 尼 边缘 检测 器 741-747 

derivatives 导数 180-184, 715-716 


526-527, 529-530 
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edge linking 边缘 连接 747-760 

false negative 伪 负 值 744 

false positive 伪 正 值 744 

gradient 梯度 187,471,623, 693,728-736， 见 Gradient 

gradient and thresholding ”梯度 和 阔 值 处 理 735 

hysteresis thresholding HAMAS! 744 

Laplacian of Gaussian (LoG) ”高 斯 拉 普 拉 斯 “737 

Marr-Hildreth edge detector Marr-Hildreth 边缘 检测 器 736-741 

models for ~ 的 模型 722-728 

nonmaxima suppression 非 最 大 抑制 ~ 743 

Prewitt edge detector Prewitt 边缘 检测 器 “730-732, 809 

ramp edges 斜坡 边缘 715-717, 722 

Roberts detector 罗伯特 检测 器 189,730 

roofedges 屋顶 边缘 715, 723-724 

Sobel edge detector Sobel 边缘 检测 器 188-190, 730-732, 810 

spaghetti effect ”意大利 通 心 粉 效应 739 

spatial filters and 空间 滤波 器 和 ~ 717 

step edges ”台阶 边缘 715-717, 722 

wavelet-based ”基于 小 波 的 ~ 529-530 
Electromagnetic (EM) spectrum 电磁 波谱 24, 29-42, 65-68 

gamma radiation {il 4485 30-31, 67-68 

imaging in = 图 像 处 理 29-42 

importance of ”~ 的 重要 性 24 

infrared regions 红外 区 域 34-40, 68 

lightand 光 和 ~ 65-68 

microwave band ”微波 频段 40-42, 67, 68 

radio band ”无线电 频段 42, 67, 68 

source of image from 来 自 ~ 的 图 像 源 29-30 

unitsof ~ 的 单位 66,67 

visible band 可见光 频段 34-40,66-67 

X-rays 义 射 线 31-33,67-68 
Electron beam computed tomography ”电子 束 计算 机 断层 ”389 
Electron microscopy 电子 显微镜 29, 42, 68, 137, 164, 278 


- Elias gamma codes Elias gamma 编码 569 


Encoding 编码 558,559,575-577 Sil. Compression 
image compression and ”图 像 压 缩 和 ~ 558,559 
mapper for ~ 有 映射 器 559 
quantizer for ~ 量化 器 559 
run-length (RLE) 行程 ~ 575-577 
symbol coder for ~ 的 符号 编码 器 559 

Empty set 484 102 

Enhancement 增强 
adaptive ” 自 适 应 ~ 150,352,354 
contrast enhancement 对比度 增 强 135, 149, 150, 208, 311, 332 
contrast stretching “对比度 拉 伸 128, 137, 138 
combined methods 组 合 的 方法 191-195 
defined 定义 的 ~ 47, 129,223 
frequency domain ”频率 域 ~ 279-320 
fuzzy techniques for ~ 的 模糊 技术 208-213 
homomorphic filtering 同 态 滤波 311 
image averaging ”图像 平均 97 
image subtraction ”图像 相 减 ”99 
histogram processing for ~ 的 直方 图 处 理 142-166 
intensity transformations ” 灰 度 变换 ”129-141 
local 局 部 ~ 161, 164, 352, 354 
median filter 中 值 滤波 器 178, 217, 348, 354,411 
order statistic filters ”统计 排序 滤波 器 178, 347 
sharpening (2) BEE 179, 302 
smoothing 平滑 97,174,291 
spatial filters ”空间 滤波 器 “166-190 

Entropy #8 554-555 

Erlang (gamma) noise ”爱尔兰 (W) MAFF 337-338 

Erosion 腐蚀 W Morphological image processing 

Estimating the degradation function ”和 佑 计 退 化 函数 ”368-372 

Euclidean distance ” 欧 氏 距离 114 W Distance 
measures ”~ 度量 (测度 ) 
norm ~ 范 数 114 

Expansions 展开 499-508, 508-510 
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basis functions of 
biorthogonal 双 正 交 ~ 500 
coefficients of ”~ 的 系数 499 
multiresolution analysis (MRA) ”多 分 辩 率 分 析 499, 503-504 
orthonormal 归 一 化 正 交 ~ 500 
overcomplete 过 完备 ~ 500 
scaling functions ~ 尺度 函数 ”499.501-505 
series 级 数 ~ 499-501, 508-510 
wavelet functions for ”~ 的 小 波 函 数 505-508 
wavelet series ”小波 级 数 ~ 508-510 | 
Exponential Golomb codes ”指数 Golomb 编码 569 
Exponential noise ”指数 噪声 338 


~ HIIER 499 


F 
False color 假 彩色 见 Pseudocolor 
False contouring {40198 85, 122, 141, 645 
Fan-beam filtered backprojections ”扇形 射线 束 滤 波 反 投 影 
403-409 
Fast Fourier transform (FFT) ”快速 傅 里 叶 变换 
Fast wavelet transform (FWT) ”快速 小 波 变换 515-523, 524-527, 
532-541 
analysis filter banks ”分 析 滤 波 器 组 517-518, 525-526 
image compression using ”使 用 ~ 的 图 像 压 缩 。626-635 
inverse 反 ~ 520-522 
multi-resolution processing using ”使 用 ~ 的 多 分 辨 率 处 理 ”515- 
523, 524-527 
synthesis filter banks ”综合 滤波 器 组 521-522, 525-526 
time-frequency tiles 时间- 频率 片 ”S$22- 523 
two-dimensional 二 维 ~ 523-527 
wavelet packets for ”~ 的 小 波 包 532-541 
FAX 传真 577 
Feature selection ”特征 选择 IL Description 
Fidelity criteria 保 真 度 准则 556-558 
Fiducial marks ”基准 标记 117 
Filters ”滤波 器 
deconvolution ”去 卷 积 ~ 368 
frequency domain H ~ 
kernels ~ 的 核 见 Spatial filters 
finite impulse response (FIR) ”有 限 冲 激 响应 ~ 
286, 490 
Hamming window ~ 的 汉 明 窗 399 
Hann window ~ 的 汉 宁 窗 399 
reconstruction ~ 重建 239 
spatial 空间 ~ Jil, Spatial filters, Spatial 
filtering ~ 滤波 
transfer function ~ 的 传输 函数 ”279 
zero-phase-shift HHF ~ 284 
Filterbanks ”滤波 器 组 491-493 
Filters, digital ”数字 滤波 器 488-495 
biorthogonal 双 正 交 ~ 492, 540-541 
coefficients ~ 3# 490 
Cohen-Daubechies-Feauveau biorthogonal coefficients Cohen- 
Daubechies-Feauveau 双 正 交 系 数 540 
convolution and 卷 积 和 ~ 489 
Daubechies 8-tap orthonormal coefficients 8 抽 头 Daubechies IF 
交 归 一 化 系数 494 
filter banks ”滤波 器 组 491-493 
filter taps 滤波 器 抽 头 “490 
finite impulse response "有限 冲 激 响 应 490 
FIR 有 限 冲 激 响应 490 
Haar coefficients ” 险 尔 系数 ”519 
impulse response ” 冲 激 响应 ”490 
JPEG-2000 irreversible JPEG-2000 不 可 逆 
modulation in ”~ 中 的 调制 ”491 
order of ”~ 的 阶 490 
order reversal in ”~ 的 反 阶 ”491 
orthonormal 归 一 化 正 交 ~ 493-494, 519, 529 
perfect reconstruction ”完美 重建 ”492 
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prototypes 原型 493 

sign reversal in ~ 的 符号 反 转 490 

symlet (4th order orthonormal) coefficients ”对 称 小 波 (第 4 BME 
交 归 一 化 ) 系 数 529 

Filter banks 滤波 器 组 491—493 

FWT analysis FWT 分 析 ~ 517-520, 533 

FWT synthesis FWT 合 成 ~ 521-522 

wavelet packet analysis ”小 波 包 分 析 535 


Filtering 滤波 
frequency 频率 ~ 见 Frequency domain filtering 
spatial 空间 ~ 见 Spatial filtering 


Finite impulse response (FIR) filters 有 限 冲 激 响应 滤波 器 286,490 
Fixed increment correction rule ”固定 增 量 修正 规则 908 
Fluorescence microscopy “荧光 显微镜 33-34 

Foreground 前 景 92, 105 

Formats for image compression 图像 压缩 格式 ”560-562, 563 
Forward mapping 前 向 映射 109 

Fourier descriptors” 傅 里 叶 描绘 子 840-843 

Fourier series ” 傅 里 叶 级 数 222-223, 225 

Fourier-slice theorem 傅 里 时 切片 定理 396-397 

Fourier spectrum {nt 131-132, 228-229, 267-271 


log transformations and 对 数 变换 和 ~” 131-132 
phase angle and 相 角 和 ~ 267-271 
plot of frequency of ~ 的 频率 图 228-229 


Fourier transform (HEM AH 227-277 
continuous 连续 ~ 227,248 
convolution #4 见 Convolution 
discrete 离散 ~ il Discrete Fourier transform 
Fast Fourier transform (FFT) ”快速 傅 里 叶 变换 IL Discrete 
Fourier transform 
history of ~ 的 历史 222-223, 326 
pair ~ 对 117,227,232,244, 248, 258, 892 
power spectrum ”~ 的 功率 谱 267 
sampling and 取样 和 ~ 233-242, 249-257 
Fractal images 分形 图 像 46-47 
Frame buffers wiZe¢7# 52 
Freeman chain code WSHE 820-823 
Frequency domain 频率 域 221-332, 804-807 
additional characteristics ”~ 的 附加 特征 ”277-279 
aliasing ~A GE) JL Aliasing 
convolution ”~ 卷 积 ” 见 Convolution 
discrete Fourier transform (DFT) ~ 离散 傅 里 叶 变换 WL 
Discrete Fourier transform 
fast Fourier transform (FFT) ”~ 快速 傅 里 叶 变 换 
Fourier transform 
filtering ~ 滤波 见 Frequency domain 
Fourier series ”~ 傅 里 时 级 数 222-223, 225 
Fourier spectrum ~ 傅 里 叶 谱 267-271 
Fourier transform ~ 傅 里 叶 变换 见 Fourier transform 
impulse ~ nh JL Impulse 
motion in segmentation ~ 分 割 中 的 运动 804-807 
sampling ~ 取样 IL Sampling 
sifting property ~ 取样 特性 JL impulse 
Frequency domain filtering ”频率 域 滤波 277-320. WL Spatial 
filtering 
bandpass filters ” 带 通 滤波 器 ”316-320, 357-362 
bandreject filters ” 带 阻 滤波 器 。、316-320, 357-362 
box filter 盒 状 滤波 器 229 
Butterworth filters” 布 特 沃 斯 滤波 器 295-298, 306-307, 316- 
319, 357-360, 373 . 
correspondence with spatial filtering 与 空间 滤波 的 对 应 性 285,291 
fundamentals of ~ 基础 279-285 
Gaussian filters for ”~ 的 高 斯 滤波 器 ”280-281, 287-291, 298- 
299, 307-308, 316-319, 357-360 
highboost filters 高 提升 滤波 器 310 
high frequency emphasis ”高 频 强 调 310 
highpass filters for ~ 的 高 通 滤波 器 280, 303-308 


见 Discrete 


homomorphic filters” 同 态 滤 波 器 311-315 


ideal filters ”理想 滤波 器 238-239, 250, 282-284, 291--295, 299, 


303-307, 316, 357-360 
Laplacian 拉 普 拉 斯 308-310 
lowpass filters ” 低 通 滤波 器 239,280,291-303 
notch filters 。 陷 波 滤波 器 316-320, 357-362 
sharpening 〈 尖 ) 锐 化 303-315 
smoothing 平滑 291-303 
steps ~ 的 步骤 285 
unsharp masking 非 锐 化 模板 310 
Frequency intervals 频率 间隔 245-246 
Frequency spectrum 频谱 T Spectrum 
FWT 518,533 
subband coding 子 带 编码 491 
wavelet packet 小 波 包 535-536 
Front-end subsystem ”前 端子 系统 51 
Full-color image processing ”全 彩色 图 像 处 理 416, 446-448 
Functionally complete “功能 完备 的 ”105 
Fuzzy sets 模糊 集合 106-107, 195-213 
aggregation of ~ 的 聚集 204,207 
color fuzzified by ”被 ~ 模糊 的 彩色 . 200-208 
definitions for ~ 定义 196-200 
defuzzification of ”~ 的 去 模糊 ”204-205, 207 
implication of ”~ 的 含义 ”201-204, 207 
intensity transformations and 灰 度 变换 和 ~ 208-211 


membership (characteristic) functions “隶属 度 (特征 ) 函数 106, 


195-200 
principles of theory ”理论 原理 ”196-200 
set operations of ~ 的 集合 操作 ”106-107, 195-196 
spatial filtering and ”空间 滤波 和 ~ 208-213 
useof -的 用 途 200-208, 208-211,211-213 


G 
Gamma {WME 
correction ~ 校正 133-135 
noise ”~ 噪声 见 Noise 
Gamma-ray imaging ” 伽 马 射线 成 像 30, 43, 69 
Gaussian filter 高 斯 滤波 咒 
frequency 频率 见 Frequency domain filtering 
spatial 空间 见 Spatial filtering 
Gaussian noise ”高 斯 噪声 见 Noise 
Gaussian pattern class “高 斯 模式 类 896-904 
Gaussian pyramid 高 斯 金字 塔 486 
Geometric mean filter 几何 均值 滤波 器 345, 383-384 
Geometric transformations ”几何 变换 109-114 
Affine 仿 射 109 
control points ”~ 控制 点 112 
identity 恒 等 = 110 
rotation 旋转 ~ 110 
scaling 尺度 ~ 110 
shearing 剪 切 ~ 110 
tiepoints ”~ 连接 点 112 
translation ”~ 平移 110 
GIF compression GIF 压缩 560, 563, 573 
Global thresholding JBA IL Thresholding 
Golomb codes and coding Glomb 代码 和 编码 566-570 
Golomb-Rice codes Golomb-Rice 编码 567 
Gradient 梯度 187-190, 469-473, 693-694, 728-736 
color segmentation ”彩色 分 割 469-473 
edge detection ”边缘 检测 ”728-736 
edge normal (vector) “边缘 法 线 (向量 ) 729 
edges 边缘 190, 469-473 
first-order derivatives, as 一 阶 导数 187-190 
gray-scale morphology ” 灰 度 级 形态 学 ”693-694 
morphological 形态 学 ~ 693 
operators ”~ 算 子 188-190, 469-473, 729-734 
Prewitt operators ”Prewitt 算 子 731-732 
properties of ~ 的 属性 728-729 


引 625 


Roberts operators Roberts 算 子 188-189, 730-730 
sharpening “〈 尖 ) 锐 化 187-190 
Sobel operators Sobel 算 子 188-190, 731-732 
thresholding, combined with 阔 值 处 理 与 ~ 735-736 
Granular noise ”颗粒 噪声 620 
Granulometry 粒度 696-697 
Gray level 灰 度 级 23,67,74,128 Sil Intensity 
Gray level co-occurrence matrix ” 灰 度 级 共生 和 矩阵 852 W 
Intensity 
Gray scale AKER 67,74 
Gray-scale morphology 灰 度 级 形态 学 。687-701 Wh 
Morphological image processing 
bottom-hat transformation ” 底 帆 变换 694-696 
closing 闭 操作 690-692, 699 
dilation 膨胀 ”688-690, 698-699 
erosion ”腐蚀 ”688-690, 699 
gradient 梯度 693-694 
granulometry 粒度 696-697 
opening 开 操 作 690-692, 699 
reconstruction 重建 ”698-701 
smoothing 平滑 692-693 
textural segmentation ”纹理 分 割 ”697-698 
top-hat transformation ” 顶 帽 变换 694-696 


H 
Haar transform MAEM 496-499 
Halftone dots FEWE 256-257 
Hamming window WHG 399 
Hann window WTB 399 
Harmonic mean filter 同 态 均值 滤波 器 345 
HDV compression HDV 压缩 ”560, 563 
Heisenberg cells/boxes ” 海 森 伯 单 元 /使 ” 522 
Heisenberg uncertainty principle 海 森 伯 测 不 准 原 理 。522 
Hertz (Hz) 赫兹 66 
High definition (HD) television ”高 清晰 度 电视 548 
High-frequency-emphasis filtering 高 频 强 调 滤 波 310-311 
Highboost filtering ”高 提升 滤波 “184-187,310-311 
Highpass filters ”高 通 滤波 器 
frequency ~ 频率 见 Frequency domain filtering 
spatial 空间 ~ 见 Spatial filtering 
HSI color model HSI 彩色 模型 424, 429-436, 465-467 
conversion from RGB RGB 至 ~ 的 转换 432-433 
conversion to RGB ~ Æ RGB 的 转换 433-435 
manipulation of images ”图 像 加 工 435-436 
plane concept of ~ 的 平面 概念 ”430-432 
segmentation ”一 分 割 465-467 
uses of ~ 的 用 途 429 
Histogram processing ”直方 图 处 理 142-166, 460-461 
definition ~ 的 定义 142 
color transformation using 使 用 = 的 彩色 变换 ”460-461 
equalization 均衡 ~ 144-150 | 
global 全 局 ~ 142-160 
intensity transformation KREI 144, 148 
inverse transformation ” 反 变 换 144, 150 
local 局 部 ~ 161-166 
matching (specification) ”匹配 (规定 化 ) 150-160 
normalized 归 一 化 ~ 142 
probability density fiction (PDF) for ~ 的 概率 密度 函数 ”145-147 
statistics, use of 统计 ~ ，~ 的 用 途 161-166 
Hit-or-miss transformation ” 击 中 或 击 不 中 变换 ”662-663 
Hole filling 孔洞 填充 665-667, 682, 684-685, 707 
Homogeniety 一 致 性 95, 366, 854 
Homomorphic filtering 同 态 滤波 ”311-315 
Hough transform ”和 霍 夫 变换 755-760 
Hue, color image processing and 色调 、 彩 色 图 像 处 理 和 -~ 
420-421, 429-436 
Huffman coding 和 霍 夫 曼 编码 564- 566 
Humaneye 人 眼 Ji Visual perception 
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H.261, H.262, H.263, H.264 560, 562, 616-618 


I 
Ideal filter 理想 滤波 器 WU Frequency domain filtering 
IEC 国际 电工 委员 会 560 
. Illumination ”照明 73-74, 762-763 
correction ~ 校正 100-101, 694-695, 778, 783 
eye response 人 眼 响应 ~ 39,59,62 
image model, in ~ 中 的 图 像 模型 73-74,311-315 
nonuniform 不 均匀 ~ 100-101, 694-695, 763, 778 
segmentation and ”分割 与 ~ 762-763 
source ~ 源 68-72 
standard ~ 标准 456, 630 
structured light ”结构 光 ~ 39 
Image 图 像 
acquisition ~ 获取 68-72 
analysis ~ 分 析 24 
blur 模糊 ~ 369-372 
color processing 彩色 ~ 处 理 416-482 
compression ~ 压缩 见 Compression 
deconvolution ”~ 去 卷 积 368 
element ~ 元 素 Jil Pixel 
enhancement ~ 增强 JL Enhancement 
filtering ~ 滤波 见 Filtering 
formation model ~ 的 形成 模型 72,311 
illumination ~ 照明 WU umination 
intensity ~ 亮度 J Intensity 
interpolation ~j JU Interpolation 
morphology ”~ 形态 学 见 Morphological image processing 
pixel ~ 像素 见 Pixel 
reflectance ~ 反射 73,311 
registration ~ AcE 97, 111,801, 864 
resampling ~ 重 取样 87, 252, 639, 821 
restoration ~ 复原 见 Image restoration 
rotation ~ 旋转 JL Geometric transformations 
scaling ”~ 尺度 变换 Jil Geometric transformations 
segmentation ~ 4) 见 Segmentation 
sensing 遥感 ~ 29-47, 68-72 
sensors ”~ 传感器 ”68-72 
shearing ”~ 前 切 见 Geometric transformations 
translation ~ 平移 JL Geometric transformations 
zooming ~ 缩放 87, 109, 252 
Image compression standards ”图 像 压 缩 标准 560-563 
Image file formats and image containers ”图 像 文 件 格 式 和 图 像 容 器 
560-563 
Image information ”图 像 信 息 553-556 
Image pyramids 图像 金 字 塔 ”485-488 
Image transforms 图 像 变 换 ” 见 Transforms 
Imaging modalities ”成 像 模 态 ”30-47 
Implication in fuzzy sets ”模糊 集合 中 的 含义 201-204, 207 
Impulse 冲 激 
continuous 连续 ~ 225-226, 247-248 
discrete 离散 ~ 169-171,247-248 
noise ~M 178-179, 338-340 
response “~ 响应 286, 366-367, 369, 490, 494, 631 
sifting property of ~ 的 取样 特性 225-227, 247-248, 490 
tain ~& 226-227, 230-231, 250 
unitdiscrete 单位 离散 ~ 169-171, 226, 247-248 
Independent frames (I-frames) hort (Wi) 611 
Information theory ”信息论 554-556 
Infrared 红外 29,34, 43, 66,99, 418, 440, 444, 712, 845, 849, 868, 901 
Intensity JRE 23, 67, 81-87 
fuzzy techniques ”~ 模糊 技术 195, 208-211 
mean ”~ 均值 见 Moments 
mapping ”~ 映射 ”564, 109-111, 128-166, 448 
quantization ~ 量化 74-76 
scale ~ 尺度 74 
scaling ”~ 尺度 变换 101-102 


statistical descriptors ”~ 统计 描绘 子 118-119, 161-166 
transformations ”~ 变换 107, 127-166 
thresholding ~ BREIE 760-785 
transformations ”~ 变换 128-166 
variance ”~ 方差 162 Ji Moments 
Intensity transformations KHER 128 
bit-plane slicing ”比特 平面 分 层 ~ 139 


contrast stretching 对比度 拉 伸 ~ 128, 137, 138 
gamma {WME ~ 132 

histogram equalization ”直方 图 均衡 ~ 142-150 
histogram matching ”直方 图 匹配 ~ 150-160 


histogram specification ”直方 图 规定 化 ”150-160 
intensity-level slicing ” 灰 度 级 分 层 137 
local 局 部 ~ 161-166 
log 对 数 ~ 131 
negative 肥 转 ~ 130 
piecewise linear 分 段 线 性 ~ 137 
powerlaw 和 客 律 ~ 132 
Interpolation Affi 87-90, 109-113, 242, 252-255, 485, 562, 615 
bicubic 双 立 方 ~ 88 
bilinear 双 线 性 ~ 88 
nearest neighbor 最 近邻 ~ 87-88 
resampling (shrinking and zooming) images by ~ HHU (缩放 ) 
图 像 87-90 
Inverse filtering UEUk 373-374 
Inverse Fourier transform {$E mH IL Fourier transform, 
Discrete Fourier transform 
Inverse mapping x (it) BEY 109 
Inverse transforms [QE Jil, Transforms 
Invisible watermarks 不 可 见 水 印 638-642 
ISO 国际 标准 化 组 织 560 
Isopreference curves ”等 偏爱 曲线 86 
Isotropic filters 各 向 同性 滤波 器 182 
ITU-T 国际 电信 联盟 远程 通信 标准 化 组 织 560 


J 

Jaggies 锯齿 254 

JBIG compression JBIG 压缩 ”560,561 

JBIG2 compression JBIG2 压缩 560,561, 583-584 

JPEG compression JPEG 压缩 ”560, 561, 601-606, 629-636 
block transform coding for ~ 的 块 变换 编码 ”601-606 

JPEG-2000 standard JPEG-2000 标 准 629-636 
wavelet coding for ”~ 的 小 波 编码 629-636 

JPEG-LS compression JPEG-LS 压缩 “560, 561, 572 
JPEG-2000 compression JPEG-2000 压缩 560, 561, 629-635 
components ”~ 成 分 630 
derived vsexpounded quantization 导出 式 量化 与 描述 式 量化 ”633 
irreversible component transform 不 可 道成 分 变换 630 
lifting-based wavelet transforms ”基于 提升 的 小 波 变换 631 
tile components 片 成 分 631 


EL 
LANDSAT satellite LANDSAT 卫星 36, 806, 848 
Laplacian 拉 普 拉 斯 
defined ~ 的 定义 182 
color 彩色 ~ 464 
convolution using 使 用 ~ 的 卷 积 811 
combined with gradient ”~ 与 梯度 的 组 合 191,772 
decomposition ”~ 分 解 ”812 
frequency domain ”频率 域 ~ 277, 308, 329-330 
isotropic property ~ 的 各 向 同性 219,721 
of Gaussian (LoG) ”高 斯 ~ 737,811 
operators ~ 算 子 183 
PDF ”~ 概率 密度 函数 610 
pyramid 金字 塔 ~ 488 | 
restoration for ”~ 的 复原 380 
scaling ”~ 尺度 变换 184 
sharpening with 使 用 ~ 锐 化 184-185, 309 


thresholding for ~ AY/Y{AAbFE 718-721, 736, 771-775 
zero crossing ~%3€% 181,725,739 
Large scale integration (LI) -大 规模 集成 27 
Least-mean-square (LMS) delta rule 最 小 均 方 德尔 塔 规则 ”909 
Lempel-Ziv-Welch (LZW) coding Lempel-Ziv-Welch 编码 573-575 
Light 光 65-68,417-423 Jl Electromagnetic (EM) spectrum 
absorption of ~ 的 吸收 418-419 
achromatic 无 色 ~ 418 
chromatic 色 ~ 418 
color image processing and 彩色 图 像 处 理 和 ~ 
microscopy 显微镜 35 
monochromatic 单 色 ~ 67 
vision and 视觉 与 ~ 见 Visual perception 
EM spectrum visible band for ”~ 的 EM 谱 可 见 波段 65-68, 
417-418 
primary and secondary color of ~ 的 原色 和 二 次 色 419-420 
Line detection 线 检测 。719-722 
Line pairs 线 对 
permm ~ 每 毫米 81 
per unit distance ”每 单位 距离 81 
Linear 线性 
convolution ~ 卷 积 Ji Convolution 
correlation ”~ 相关 Jil Correlation 
FIR filters FIR 滤波 器 286 
frequency domain filters ”频率 域 滤波 器 272 


417-423 


masks 模板 172 

motion ~ 运动 371,388 

operations ”~ 操作 95-96, 276, 365-368 
transforms ”~ 变换 115 

spatial filters ~ 空间 滤波 器 167, 172 
system ~i 225, 334, 365-368 


Linearly separable classes ”线性 可 分 类 908-909 
Live image 活动 图 像 99 
Lloyd-Max quantizer” 劳 埃 德 -马克 斯 量化 器 ”625 
Log transformations ”对 数 变换 131-132 
Logical operations “逻辑 操作 (运算 ) 105-106 
Lossless predictive coding “无损 预测 编码 ”606-611 
Lossy predictive coding ”有 损 预 测 编码 618-621 
Lowpass filters ” 低 通 滤波 器 
frequency ~ 频率 Jil Frequency domain 
filtering ~ 滤波 
spatial 空间 ~ JL Spatial filtering 
LSB watermarks LSB KE) 638 
Luminance, chromatic light and 亮度， 色光 和 ~ 
LZW coding LZW 编码 


67, 418 
W Lempel-Ziv-Welch (LZW) coding 


M 

Mach bands ”马赫 带 63, 64 

Macroblocks #38 611 

Magnetic resonance imaging (MRI) 磁 共 振 成 像 42, 72, 112, 135,390 

Mahalanobis distance BRER 785 il Distance measures 

Mallat’s herringbone algorithm Mallat herringbone 算法 515 

Mapper 映射 器 559 

Mapping 映射 109-110, 154-155, 157-158, 552, 559-560 见 
Intensity 
decoding (decompression) and 解码 (分 解 ) 和 ~ 560 
encoding (compression) and ”编码 (压缩 ) 和 ~ 559 
forward 前 向 ~ 109-110 


histogram processing and 直方 图 处 理 和 -~ 154-155, 157-158 


inverse 反 ~ 110,560 
Markers 标记 
morphological reconstruction for ~ 的 同 态 重建 ”678-686; 698- 
699 
thresholding ”~ 阅 值 处 理 772 


watersheds for 分 水 岭 ~ 798-800 
Markov sources ”马尔 可 夫 源 556 
Marr-Hildreth edge detector Marr-Hildreth 边缘 检测 器 ”736-741 
Masks 模板 见 Spatial filters 


引 627 
definition ~ 的 定义 128 

masking function #2#ZPARL 593 

threshold ”~ 阅 值 599 


unsharp masking and” 非 锐 化 模板 和 ~ 
Mask mode radiography ”遮光 方式 造影 99 
Matching 匹配 888-894, 925-928 
block 块 ~ 612-613 
correlation, by ”~ 相关 891-894 
minimum distance classifier 最 小 距离 分 类 器 
method ”~ 方法 888-891 
shape numbers ”~ 形状 数 925-926 
strings ~ 926-928 
Matrix operations ”和 矩阵 操作 78, 94-95, 114-115 
array operations versus ”阵列 操作 与 = 94-95 
notation for pixels ”~ 像素 的 表示 78 
vector operations and ”向 量 运算 和 ~ 
Max filters 最 大 滤波 器 ”174, 348 
Mean absolute distortion (MAD) ”均值 绝对 失真 ”612 
Mean filters ”均值 滤波 器 ” 见 Spatial filters 
Mean of intensity ”亮度 均值 ” 见 Moments 
Mean pyramid 均值 金字 塔 486 
Mean square error (MSE) ” 均 方 误差 
filtering in ”~ 的 滤波 374-379 
measure ~ 度量 376 
Medial axis transformation (MAT) ”中 轴 变 换 834-835 
Median filters ”中 值 滤波 器 ”178-179, 348, 411 
adaptive ” 自 适应 ~ 354-357 
updating 更 新 ~ 218 
Membership (characteristic) functions SERRE (特征 ) 函数 ”106， 


195-200 
Mexican hat ”墨西哥 由 
operator ~ 算 子 737 
wavelet ~ 小 波 514 
Micron 微 66 
Microdensitometer ” 微 光 密度 计 计 70 
Microwave 微波 29, 40, 66,440 
Midpoint filter 中 点 滤波 器 349 
Min filter 最 小 滤波 器 179,349 
Minimum distance classifier ”最 小 距离 分 类 器 888-891 
Minimum-perimeter polygon (MPP) “最 小 周 长 多 边 形 823-829 
Minkowsky 闵可夫 斯 基 
addition ~ 相 加 705 
subtraction ”~ 相 减 ”704 
M-JPEG 560, 563 
Modified Huffman (MH) coding “改进 的 霍 夫 曼 编 码 577 
Modified READ (MR) coding 改进 的 READ 编码 578 
Modified Modified READ (MMR) coding 改进 的 改进 的 READ 编 
码 578 
Modulation 调制 491 
Modulation function ”调制 函数 363 
Moiré pattems 葛 尔 (波纹 ) 模 式 255-257, 318 
Moments ‘i p 
statistical 统计 ~ 118-119, 843, 850, 881, 885 
invariant 不 变 ~ 861-864 
Monochromatic (achromatic) light HEEE) 67,418 
Moore boundary tracking algorithm ” 阐 尔 边界 追踪 算法 818-819 
Morphological image processing “形态 学 图 像 处 理 649-710 
alternating sequential filtering ”交替 顺序 滤波 ~ 692 
binary images, summary 二 值 图 像 ， 小 结 684-686 
black top-hat 黑色 项 帽 - 694 
border clearing 边界 清除 IL Morphological reconstruction 
bottom-hat transformation ” 底 帽 变换 694 
boundary extraction ”边界 提取 664-665 
closing HJE 657-391, 690-692 
connected components ”连通 分 量 667-669 
convex hull Maë 669-671 
dilation 膨胀 655-657, 678-681, 688-690 
erosion ”腐蚀 652-655, 657, 678-681, 688-690 


184-187 


114-115 


628 


filtering 滤波 ”649, 655, 660, 692, 709 

gradient 梯度 693 

granulometry ”粒度 696 

gray-scale JRE 687-702 

hit-or-miss transformation ” 击 中 或 击 不 中 变换 662-663 
hole filling 孔洞 填充 665-667, 684-685 

opening 开 操作 657-661, 681, 684, 690-692 
operations summary of ~ 的 操作 小 结 684-686 
preliminaries ”~ 预备 知识 650-652 

pruning YY 676-678 

reconstruction ”~ 的 重建 ” 见 Morphological reconstruction 


reflection of sets in ~ 中 的 集合 的 反射 ”650 
set operations for ”~ 的 集合 操作 102-106, 650-652 


shading correction ”阴影 校正 695 
skeletons 骨架 673-676 JL Skeletons 
smoothing 平滑 692 
structuring element 结构 元 ”651 
textural segmentation 纹理 分 割 697 
thickening 粗 化 672-673 
thinning 细 化 671-672 
top-hat transformations ” 顶 帆 变换 694, 699 
translation of sets in ~ 的 集合 平移 651 
white top-hat Af JiR 694 
Morphological reconstruction ”形态 学 重建 ”678-686,698-701 
border clearing and 边界 清除 和 -~ 685-686 
dilation by 被 ~ 膨胀 680-681, 698-699 
erosionby 被 ~ 腐蚀 680-681, 699 
geodesic dilation and erosion ” 测 地 膨胀 和 腐蚀 678-681, 698-699 
gray-scale images and 灰 度 图 像 和 ~ 698-701 
hole filling and 孔洞 填充 和 ~ 684-685 
opening by 被 ~ 开 操作 681, 684, 699 
top-hatby 被 ~ 项 帽 699 
Motion compensation, predictive coding and 运动 补偿 ， 预 测 编码 
和 ~ 611-618 
Motion estimation ”运动 估计 612-616 
Motion in segmentation ”分割 中 的 运动 ，800-807 
accumulative difference image (ADI) 累积 差分 图 像 801-802 
frequency domain techniques for 频率 域 技术 804-807 
reference images, establishment of 参考 图 像 ，~ 的 建立 803-804 
spatial techniques for ~ 的 空间 技术 800-804 
Moving averages for thresholding ” 阔 值 处 理 的 移动 平均 781-783 
MPEG-1, MPEG-2, MPEG-4(AVC) 560, 562, 616-618 
MQ-coder MQ 编码 器 572 
Multilayer feedforward neural networks ”多 层 前 馈 神 经 网 络 841-924 
Multiresolution analysis (MRA) ”多 分 辨 率 分 析 499, 503-504 
requirements for ~ 的 需求 503-504 
Multiresolution processing ”多 分 辨 率 处 理 483-546 
expansions 展开 499-508 
Haar transform MAKE 496—499 
image pyramids 图 像 金字 塔 485-488 
MRA equation MRA 方 程 504 
multiresolution analysis (MRA) ”多 分 辩 率 分 析 499, 503-504 
scaling functions ”尺度 函数 499, 501-505, 523-524 
series expansions ”级 数 展开 499-501, 508-510 
subband coding 子 带 编码 488-495 
theory of ~ 的 理论 483-484 
wavelets and 小 波 和 ~ 483-546 
Multispectral imaging 多 光谱 成 像 36-37, 114, 444, 848, 868-871, 
901-903 


N 
Nanometer 纳米 66 


Negative images” 反 转 图 像 负 像 ) 104, 107, 130-131 


Neighborhood $i 
definition ~ 的 定义 90 
operations ”~ 操作 107-109, 127-128, 167-191 


Neighbor ofa pixel 像素 的 邻 域 90 
nearest 最近 ~ 88, 109-111, 242,252 见 Interpolation 


数字 图 像 处 理 (第 三 版 ) 


types ”~ 类 型 90-91 

Neural networks 神经 网 络 904-924 
algorithms for ”~ 算法 908-911 
back propagation, training by ” 反 向 传播 ，- 训练 914-921 
background of ”~ 的 背景 904-905 
decision surfaces, complexity of 决策 面 ，~ 复杂 性 921-924 
multilayer feedforward 多 层 前 馈 841-924 


perceptrons for ”~ 的 感知 机 905-907, 908-911 
training (learning) process for ”~ 的 训练 (学 习 ) 处 理 904-924 
training pattems ”~ 训练 模式 904 


N-largest coding 最 大 和 编码 599 
Noise 噪声 75, 80, 161 
bipolar 双 极 ~ 338 
color images in ~ 中 的 彩色 图 像 473 
data-drop-out 数据 清除 338 
Erlang 爱尔兰 ~ 337 
exponential 指数 ~ 338 
gamma 伽 马 ~ 337 


Gaussian 高 斯 ~ 98, 336 

impulse 脉冲 ~ 178,338 

models -模型 335 

parameter estimation ~ 参数 估计 341 

periodic 周期 ~ 319, 340-341, 357 

power spectrum ”功率 谱 ~ 375 

probability density functions (PDF) ”概率 密度 函数 336-341 


Rayleigh 瑞 利 ~ 336 
reduction 降低 ~ Jil Filtering 
salt-and-pepper 椒盐 ~ 178,338 
spatial and frequency properties of ~ 的 空间 和 频率 属性 335-336 
spike ~ 人 尖峰 338 
uniform 均匀 ~ 338 
unipolar 单 极 ~ 338 
white Á~ 335,376, 530, 742, 806 
Noiseless coding theorem 无 噪声 编码 理论 555 
Nonlinear 非 线 性 
filtering ”~ 滤波 167, 174, 178, 187, 347, 352, 892 
operation ~ 操作 95-96, 124 
Nonseparable classes ”不 可 分 类 ”909-911 
Notch filters ” 陷 波 滤波 器 Jil Frequency domain filtering 
Null set 4542 102 
Nyquist rate 奈奈 斯 特 率 I Sampling 


o 

Object recognition ”对象 识别 WL Patterns, Recognition 
Opening 开 操 作 TL Morphological image processing 
Optical illusions ”错觉 64-65 

Order-statistic filters ”统计 排序 滤波 器 I Spatial filters 
Ordered pairs product 顺序 对 积 U Cartesian 
Orthonormality J4—{KiIE% 493 

Otsu’s method Otsu 方 法 JL Threshold, Thresholding 


P 

Parallel-beam filtered backprojections 
397-403 

Parallel distributed processing (PDP) models 并 行 分 布 处 理 模型 904 

Pattems 模式 883-931 
back propagation and 反 向 传播 与 ~ 
class structure of ”~ 类 结构 883-887 
classifiers ”~ 分 类 器 888-891, 894-904 
decision surfaces and 决策 面 和 ~ 921-924 
discriminant (decision) analysis for ”~ 的 判别 (决策 ) 分 析 

884-885, 887 

Gaussian class ”高 斯 类 ~ 896-904 
linearly separable classes ”线性 可 分 类 ~ 
matching ~ 匹配 888-894, 925-928 
multiclass recognition 多 类 识别 ~ 911-924 
neural networks and 神经 网 络 与 ~ 904-924 
nonseparable classes 不 可 分 类 ~ 909-911 


平行 射线 束 滤 波 反 投影 


914-921 


908-909 


索 


object recognition and 对 象 识别 与 ~ 883-924 
perceptrons and 感知 与 ~ 905-907, 908-841 
recognition and 识别 与 ~ ”883-931 
training (learning) ”~ 训练 (学 习 ) 904-924 
vector generation for ”~ 的 向 量 生成 ”884-886 
PDF 概率 密度 函数 ”560, 563, 585 
Pel 像素 见 Pixel 
Percentile 百分比 179, 348-349, 773 
Perceptrons ”感知 机 905-907, 908-841 
Perfect reconstruction filters “完美 重建 滤波 器 492-493 
Periodic impulses ”周期 冲 激 1 Impulse train 
Phase angle #8ff JL Fourier transform, Discrete Fourier transform 
Photoconverter 光电 转换 器 69 
Photodiode 光电 三 极 管 70 
Photons 光子 29,67 
Photopic vision FI (FE) MRE 59 
Piecewise-linear transformation functions 分 段 线性 变换 函数 137-141 
Pixel 像素 
adjacency of ~ 邻接 90 
array operations ~ 的 阵列 操作 ”94 
connected 连通 ~ 91 
definition ”~ 的 定义 24,78 
distance between ~ 间 的 距离 93 
interpolation ~ Hif W Interpolation 
neighborhood operations filtering "” 邻 域 操作 滤波 107-109 见 


Spatial 
neighbors of ~ 的 邻 域 90 
path ~ 路 径 91 


perunitdistance ”每 单位 距离 ~ 81 
relationships between ~ 间 的 关系 90 
single operation ~ 的 单个 操作 107 
transformation ~ 的 变换 VL Intensity transformations 
PNG compression PNG JE4% 560,563, 573 
Point detection ASW WL Segmentation 
Point processing 点 处 理 128-129 
Point spread function ”点 扩散 函数 367 
Polygonal approximation ”多 边 形 近 似 823-829, 829-830 
merging techniques ”~ 聚合 技术 829-830 
minimum-perimeter polygons (MPP) “最 小 周 长 多 边 形 ，823-829 
splitting techniques ~ 4} 830 
Positron emission tomography (PET) “ 正 电子 发 射 断 层 术 31,72, 
112, 315, 390, 410 
Power-law (gamma) transformations FR(M) 变换 132-137 
Power spectrum “功率 谱 267,375 
Prediction errors ”预测 误差 606 
Prediction residuals ”预测 残 差 610 
motion compensated 运动 补偿 ~ 611-617 
pyramid -人 金字塔 486,488 
Predictive coding ”预测 编码 ”606-625 
delta modulation (DM) ”德尔 塔 ( 增 量 ) 调 制 。”619-620 
differential pulse code modulation (DPCM) ”差分 脉冲 编码 调制 
621-624 
lossless 无 损 ~ 606-611 
lossy 有 损 ~ 618-621 
motion compensation and 运动 补偿 和 ~ 611-618 
optimal predictors for ”~ 的 最 佳 预 测 器 、621-624 
optimal quantization in ”~ 中 的 最 佳 量化 ”624-625 
prediction error for ~ 的 预测 误差 606-607, 621-624 
Predictive frames (P-frames) ”预测 帧 (P 帧 ) 612 
Previous pixel predictor ”前 像素 预测 器 ”608 
Prewitt gradient operators Prewitt 梯度 算 子 IL Spatial filters 
Probability density function (PDF) ”概率 密度 函数 ”145-147,336= 
341, 895-904 
Erlang 爱尔兰 ~ 337 
exponential 指数 ~ 338 
gamma 伽 马 ~ 337 
Gaussian 高 斯 ~ 98, 336, 897 
impulse 冲 激 ~ 178, 338 
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parameter estimation ~ 参数 估计 341 
Rayleigh 瑞 利 ~ 336 
salt-and-pepper 椒盐 ~ 178, 338 
uniform 均匀 ~ 338 
Probability mass function (PMF) ”概率 质量 函数 567 
Probability models ”概率 模型 572-573 
Projections, image reconstruction from 投影, 图 像 重 建 形 式 384409 
Pruning 裁剪 Ji, Morphological image processing 
Pseudocolor image processing ” 伪 彩 色 图 像 处 理 416, 436-446 
intensity slicing for ”~ 的 灰 度 分 层 437-440 
intensity-to-color transformations” 灰 度 至 彩色 变换 ”440-443 
monochrome images and 单 色 图 像 和 -~ 444-446 
transformations of ~ 的 变换 436-446 


Q 
Q-coder Q 编码 器 572 
Quantization 量化 ”74-90, 553, 559-560, 618-620, 624-625, 629 
见 Sampling 
dead zone ~ EK 629 
intensity resolution and 灰 度 分 辨 率 和 ~ 81-87 
interpolation and 内 插 和 ~ 87-90 
Lloyd-Max quantizer 劳 埃 德 -马克 斯 量化 器 ”625 
mapping and 映射 和 ~ 553,559-560 
optimal 最 佳 ~ 624-625 
predictive coding and ”预测 编码 和 ~ 618-620, 624-625 
wavelet coding design of ~ 的 小 波 编 码 设 计 629 
Quicktime 一 种 压缩 格式 ”560, 563 


R 
Radiance, chromatic light and 辐射 、 色 光 和 ~ 67,418 
Radio band 无线电 波段 29, 42, 66, 301 
Ram-Lak filter Ram-Lak 滤波 器 398 
Random fields ”随机 场 120 
Radon transform ”随机 变换 388, 390-395 
Ramp edges ” Ramp 边缘 见 Edges 
Rayleigh noise AIME J Noise 
Recognition 识别 49-50, 883-931 
Bayes classifier 贝 叶 斯 分 类 器 ~ 894-904 
classifiers for ~ 的 分 类 器 888-891, 894-904 
correlation 相关 ~ 891-885 
correlation coefficient ”相关 系数 ~ 892-894 
decision-theoretic methods for ~ 的 决策 理论 方法 888-924 
discriminant analysis ”判别 分 析 ~ 884 
feature selection ”特征 选取 ~ 885 
leaming ~ 学 习 883 
matching and 匹配 和 ~ 888-894, 925-928 
minimum-distance 最 小 距离 ~ 888 
neural networks for ~ 的 神经 网 络 904-924 
optimum classifiers ”最 佳 分 类 器 ~ 894-896 
pattems 模式 ~ 883-924 
shape number matching 形状 数 匹 配 ~ 925-926 
string matching FFM ~ 926-928 
structural methods for ~ 的 结构 方法 925-928 
Reconstruction 重建 ”239.241-242, 384-409, 678-686, 699-702 
backprojection MLL ~ 385-387, 397-403, 403-409 
computed tomography (CT) ”计算 机 断层 ~ 387-390 
fan-beam filtered backprojections “扇形 射线 束 滤波 后 的 反 投 
影 ~ 403-409 
filters 滤波 器 ~ 239 
Fourier-slice theorem for -的 传 里 时 切片 定理 396-397 
function, recovery ofa 函数 ，-~ 的 恢复 241-242 
gray-scale morphological 灰 度 形态 学 ~ 699-702 
image restoration by ”~ 图像 复原 384-409 
laminogram 层 图 ~ 395 
morphological 形态 学 ~ 678-686, 699-702 
parallel-beam filtered 平行 射线 束 滤波 ~ 
backprojections MHK ~ 397-403 
projections, from ”投影 ,来自 ~ 384409 
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Radon transform for ~ 的 雷 登 变换 390-395 
Ram-Lak filter Ram-Lak 滤波 器 ~ 398 
Shepp-Logan phantom Shepp-Logan 约 影 ~ 394 
sinogram 1E% ~ 393 
Redundancy 元 余 548-552 
coding 编码 ~ 549, 550-551 
relative data ”相对 数据 ~ 548-549 
spatial 空间 ~ 549, 551-552 
temporal 时 间 ~ 549, 551-552 
Reference images ”参考 图 像 111-113, 800-804, 806 
Refinement equation ” 细 化 方程 504 
Reflectance 反射 67,73-74,311-315,762-763 
Region 区 域 
definition ~ 的 定义 91 
growing ~ 生长 ” 见 Region-based segmentation 
of interest (ROI) 感 兴 趣 ~ 100, 633, 665, 677, 790 
quadregions 1/4~ 789 
splitting ~4}% Jil, Region-based segmentation 
descriptors ~ 描绘 子 见 Description 
Region-based segmentation ”基于 区 域 的 分 割 785-791 
merging regions RAKA 788-791 
region growing KIREK 785-788 
splitting regions 分裂 区 域 788-791 
Regional descriptors ”区 域 描绘 子 844-864 
area 区 域 844 
circularity ratio for ”~ 的 圆 度 率 844-845 
compactness and 致密 性 和 ~ 844-845 
contrast ~ 对 比 854-856 
correlation ~ 相关 854-856 
entropy ~ 的 炉 854-856 
Euler number 欧 拉 数 ”847 
gray-level co-occurrence matrix 灰 度 级 共生 和 窍 阵 852 
homogeneity 同 质 性 854-856 
maximum probability 最 大 概率 854-856 
moment invariants for ~ 的 矩 不 变 861-864 
perimeter 周 长 844 
principal components ” 主 成 分 864 
relational descriptors ”关系 描绘 子 874 
texture content of ~ 的 纹理 内 容 849-861 
topological 拓扑 845-849 
uniformity 均匀 性 , 一 致 性 854-856 
Registration, image CME, 图像 97, 111, 801, 864 
Relative Element Address Designate (READ) coding ”相对 元 素 寻 址 
设计 编码 578 
Remote sensing 遥感 ”36-37, 548, 893, 901 
Representation 表示 49, 817-882 
boundary (border) following 边界 (边界 ) 追 踪 ~ 818-820 
boundary segments for ~ 的 边界 分 段 832-834 
chain codes for ”~ 的 链 编码 820-823 
description and 描述 和 ~ 817-882 
polygonal approximation ”多 边 形 近 似 ~ 823-829, 829-830 
signatures for ~ 的 标记 图 830-832 
skeletons ”~ 的 骨架 834-837 
Resampling 重 取样 Jil Image resampling 
Reseau marks ”网 状 标记 112 
Restoration 复原 48, 333-415 
blind deconvolution HA#S~ 368 
constrained least squares filtering ”约束 最 小 二 乘 方 滤波 ~ 
379-383 
deconvolution ”去 卷 积 ~ 368 
degradation functions, estimation ”退化 函数 ， 估 计 368-373 
degradation of an image ”一 幅 图 像 的 退化 ”333, 334-335, 365- 
368, 368-373 
frequency domain filtering for ~ 的 频率 域 滤波 
noise reduction KÆR 357-365 
geometric mean filter 几何 均值 滤波 器 383-384 
inverse filtering WIYE 373-374 
least square error filter ”最 小 平方 误差 滤波 器 375 


linear, positive-invariant 线性 ~， 位 置 不 变 ~ 
degradations 退化 365-368 
minimum mean square error filtering ”最 小 均 方 误差 滤波 374-379 
noise models for ”~ 的 噪声 模型 ”335-343 
noise reduction and 降 噪 和 ~ 344-357, 357-365 
parametric Wiener filter 参数 维 纳 滤波 器 384 
reconstruction ”~ 的 重建 ” 见 Reconstruction 
spatial filtering for noise ”噪声 的 空间 滤波 
reduction 降低 ~ 344-357 
spectrum equalization filter 谱 均 衡 滤 波 器 ”384 
Wiener filtering ” 维 纳 滤波 器 ”374-379 
RGB color models RGB 彩色 模型 423-424, 424-428, 432-435, 
467-469 
conversion from HSI format JM HIS 格式 至 RGB 格式 的 转换 
433-435 
conversion to HSI format 从 RGB 格式 至 HIS 格式 的 转换 
432-433 
cube concept of ~ 的 立方 体 概念 ”424-428 
safe colors 稳定 色 426-428 
segmentation and 分割 和 ~ 467-469 
Rice codes ” 莱 斯 编码 567 
Roberts cross-gradient operators ”罗伯特 交叉 梯度 算 子 188-189, 
730-730 
Robust invisible watermarks ANAT KEN 639 
Roofedges 屋顶 边缘 715,723-724 
Root-mean-square (rms) error 均 方 根 误差 376, 556-558 
Rubber-sheet transformations ”橡皮 膜 变 换 109-114 
Run-length coding (RLE) 行程 编码 552, 575-581 
Run-length pairs 行程 对 552, 575 


S 
Safe colors 稳定 色 426-428 
Salt-and-pepper noise ”椒盐 噪声 ” 见 Noise 
Sampling 取样 74-90,233-242,245-246,249 257 见 
Quantization 
aliasing ”~ 混淆 JU Aliasing 
basic concepts of ”~ 的 基本 概念 74-76 
decimation ”~ 抽取 253 
Fourier transform and {PEHARA ~ 233-242, 249-257 
intensity resolution ”~ 灰 度 分 辩 率 81-87 
interpolation and 内 捅 和 ~ 87-90, 252-255 
intervals ”~ 间隔 245-246 
jaggies ~ 锯齿 254 
moiré patterns from -一 导致 的 莫 尔 模式 255-257 
Nyquistrate 奈奈 斯 特 率 237-238 
one-variable functions HÆR 233-242 
reconstruction (recovery) ”重建 (恢复 ) 241-242, 252-255 
representing digital images by H ~ 表示 数字 图 像 77-81 
sensor arrangement and ”传感器 排列 和 ~ 76 
spatial coordinates (x,y) and ”空间 坐标 (xy) 和 ~ 74-90 
spatial resolution 空间 分 辩 率 81-87 
super-sampling 超 取 样 253 
theorem ~ 定理 235-239, 249-250 
two-variable (2-D) functions 二 变量 (二 维 ) 函数 249-257 
Saturation 饱和 度 80, 320-421 
Scaling 尺度 变换 
geometric 几何 ~ 见 Geometric transformations 
intensity 灰 度 ~ 101-102 
Scaling functions ”尺度 函数 499, 501-505, 523-524 
coefficients of ~ 的 系数 504 
Haar 险 尔 ~ 502 
separable 2D ”可 分 二 维 ~ 523 
Scaling vectors 尺度 向 量 504 
Scanning electron microscope (SEM) ”扫描 电子 显微镜 45,137, 
164, 278 
Scotopic vision iff, 59 
Segmentation ”分割 711-816 
color 彩色 ~ 465-472 


definition ~ 的 定义 712 
edge-based ”基于 边缘 的 ~ 
foundation 基础 712-717 
frequency-based 基于 频率 的 ~ 
line detection RR 719 
motion and 运动 和 ~ 800-807 
point detection 点 检测 718 
region growing 区 域 生长 ” 见 Region-based segmentation 
texture based ”基于 ~ 的 纹理 791 
thresholding ”~ 阅 值 处 理 见 Thresholding 
watersheds 分水岭、 见 Watersheds 

Sensors 传感器 50, 68-74, 76 


见 Edge detection 


804-807 


acquisition and 获取 与 ~ 68-74 

arrays ~ 阵列 “72,76 

cooling 冷却 ~ 98 

image formation model for ~ 的 图 像 形成 模型 73-74 


imaging component for ~ 成 像 成 分 50 
sampling and quantization using 使 用 ~ 取样 和 量化 ”76 
single 单 ~ 70 
strips ~ 条 带 70-72,76 

Sequential baseline system 顺序 基线 系统 602 

Series expansions ”级 数 展 开 499-501, 508-510 

Set operations “集合 操作 (运算 ) 102-105, 106-107, 650-652, 652- 
657, 657-661 L Fuzzy sets 
basics of ~ 的 基础 ”102-105 
closing ”~ 的 开 操作 657-391 
crisp 干脆 ~ 106 
dilation ”~ 膨胀 655-657 
erosion “~ 腐蚀 652-655, 657 
fuzzy concept of ~ 的 模糊 概念 106-107, 195-213 
morphological image processing and 形态 学 图 像 处 理 和 - 
650-652, 652-657, 657-661 
opening 开 操作 657-661, 690-692 

Shading correction “阴影 校正 100-101, 695, 763, 783 

Shannon’s first theorem ” 山 农 第 一 定理 555-556 

Shape numbers ”形状 数 838-839, 925-926 

Sharpening (42) Bik ” 见 Filtering 

Shepp-Logan phantom Shepp-Logan 幻影 394 

Shrinking 缩小 见 Image resampling 

Sifting property 取样 特性 ” 见 Impulse 

Signal-to-noise (SNR) ratios {AMBRE 376,557 

Signatures 标记 图 830-832 

Simultaneous contrast ”同时 对 比 63-64 

Single-pixel operations” 单 像素 操作 107 

Skeletons 骨架 673-676, 834-837 

Slope overload 斜率 过 载 620 

Smoothing 平滑 见 Filtering 

SMPTE ”活动 图 像 和 电视 工程 师 协会 ”560 

Sobel gradient operators Sobel 梯度 算 子 Sil. Spatial filters 

Software for imaging 图 像 处 理 软件 51-52 

Spatial coordinates ”空间 坐标 “23, 77 

Spatial domain ”空间 域 
convolution ~ 卷 积 Jil Convolution 
correlation ~ 相关 JL Correlation 
definition ”~ 的 定义 77 
image transform difference ”~ 图 像 变 换 差 
filtering ~ 滤波 见 Spatial filtering 
frequency domain ”频率 域 与 ~ 
correspondence ”~ 对 应 ”285 
operations ”~ 操作 107-114 

Spatial filters AMMER Ji Spatial filtering 
adaptive local ” 自 适应 局 部 ~ 352-354 
adaptive median ” 自 适 应 中 值 ~ 354-357 
alpha-trimmed 修正 的 阿尔 法 ~ 349 
arithmetic mean 算术 平均 ~ 344 
averaging 平均 ~ 174 
contraharmonic mean ”上 反 调和 平均 ~ 345 
defined ~ 的 定义 128 


115-116 
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generating ~ 生成 173 
geometric mean 几何 平均 ~ 345 
gradient ~ 梯度 187 
harmonic mean 调和 平均 ~ 345 
highboost 高 提升 ~ 184 
isotropic 各 向 同性 ~ 182 
Laplacian ” 拉 普 拉 斯 ~ 182-185 
lowpass 低 通 ~ 174 
max 最 大 ~ 179,348 
median 中 值 ~ 178, 348 
midpoint 中 点 ~ 349 
min 最 小 ~ 179,348 
order statistic ”统计 排序 ~ 
Roberts 罗伯特 ~ 189 


178-179, 347 


sharpening “( 尖 ) 锐 化 = 179-190 
smoothing 平滑 ~ 174-179, 344 


Sobel Sobel~ 189 
unsharp mask ” 非 锐 化 模板 ~ 184 
vector representation ”~ 向 量 表 示 172 
weighted average ”加 权 平 均 ~ 175 

Spatial filtering ”空间 滤波 126-220, 344-357 
adaptive local ” 自 适 应 局 部 ~ 352-354 
adaptive median ” 自 适 应 中 值 ~ 354-357 
convolution and RAI- 168-172 
correlation and 相关 和 ~ 168-172 
defined 一 的 定义 128 
enhancement methods combined 组 合 ~ 的 增强 方法 
fundamentals of ~ 的 基础 ”166-174 
fuzzy techniques for ”~ 模糊 技术 195-213 
linear 线性 ~ 167-177 
masks ”~ 模板 见 Spatial filters 
mechanics of ”~ 的 机 理 167 
noise reduction by ~ HIME 344-357 
nonlinear 非 线 性 ~ 167, 177-179, 344-357 
order-statistic "统计 排序 ~ 177-179, 347 
sharpening (22) Bk ~ 179-190 
smoothing 平滑 ~ 174-179 
vector representation of ”~ 的 向 量 表示 

Spatial operations ”空间 操作 “107-114 

Spatial redundancy ”空间 元 余 549, 551-552 

Spatial resolution ”空间 分 辨 率 81-87 

Spatial techniques for motion in segmentation ”分割 中 运动 的 空间 技 
术 800-804 

Spatial variables ”空间 变量 77 

Spectrum 谱 il Fourier transform, Discrete Fourier transform 

Standard definition (SD) television 标准 清晰 度 电 视 547-548 

Standards for image compression ”图 像 压 缩 标准 560-562, 563 

Statistical moments HHE i Moments 

Stochastic image processing ”随机 图 像 处 理 120 

Storage capacity for imaging 成像 的 存储 容量 52 

String descriptions ” 串 描述 ”886-887, 926-928 

Subband coding 子 带 编码 - 488-495 

Subjective brightness ”主观 亮度 61 

Subsampling pyramids ” 子 取样 金字 塔 。486 

Subspace analysis trees ” 子 空 间 分 析 树 533 

Successive doubling ”逐次 加 倍 322 

Sum of absolute distortions (SAD) ”绝对 失真 之 和 ”612 

Superposition integral HY} 367 

Super-sampling ” 超 取样 ”253 

Symbol coders ”符号 编码 器 559 

Symbol-based coding ”基于 符号 的 编码 581-584 

Symlets 对称 小 波 527-529 

Synthesis filter banks ”综合 滤波 器 组 492, 521-522, 525-526 

Synthetic imaging 合成 成 像 46-47 


191-195 


172-173 


T 
Temporal redundancy ”空间 元 余 549, 551-552 
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Texture 纹理 697-698, 791, 849-861 
co-occurrence matrix for ~ 的 共生 和 矩阵 852-858 
description by ”~ 描述 849-861 
gray-scale morphology and 灰 度 形态 学 和 ~ 697-698 
intensity histogram for ~ 的 灰 度 直方 图 850-852 
segmentation ”~ 分 割 697-698, 791 
spectral approaches to ~ 的 谱 方法 859-861 
statistical approaches for ~ 的 统计 方法 850-858 
structural approaches for ~ 的 结构 方法 858-859 
Thematic bands ” 热 波 段 36 
Thickening 粗 化 Ji Morphological image processing 
Thinning 细 化 见 Morphological image processing 
Threshold I(E WEEE) W Thresholding 
basic ”~ 基础 129, 760, 763 
Bayes 贝 叶 斯 ~ 764,897, 903-904 
coding ”~ 编码 597-601 
color ~ 彩色 467 
combined with blurring ”~ 与 模糊 相 组 合 191 
combined with gradient ”~ 与 梯度 相 组 合 735, 771 
combined with Laplacian ”~ 与 拉 普 拉 斯 相 组 合 。772 
global 全 局 ~ 763 
hysteresis 滞后 ~ 744,776 
local 局 部 ~ 780-783 
optimum 最 佳 ~ 764 
Otsu Otsu~ 695,764,774 
multiple 多 ~ 744,761, 774-778 
multivariable 多 变量 ~ 467, 783-785 
variable 可 变 ~ 778 
Thresholding ” 立 值 处 理 ”129, 137, 530, 599-601, 735-736, 760-785 
basics ”~ 基础 760 
Bayes DIH ~ 764, 897, 903-904 
coding implementation ~ 编码 实现 599—601 
edges using in ~ 中 使 用 的 边缘 771 
function ”~ 函数 129, 137 
global 全 局 ~ 760, 763-778 
gradients, combined with ”~ 梯度 ， 与 ~ 的 组 合 735-736 
hard 硬 ~ 530 
illumination and 照度 和 ~ 762-763 
intensity ~ JRE 760-761 
Laplacian, combined with 拉 普 拉 斯 ， 与 ~ 相 组 合 772 
local 局 部 ~ 780-783 
measure of separability ”可 分 离 性 度量 ~ 767 
moving averages ”移动 平均 ~ 781 
multiple thresholds Z~ 774 
multivariable 多 变量 ~ 467, 783-785 
noise in ~ 中 的 噪声 761-762 
object point for ”~ 的 目标 点 760 
optimum 最 佳 ~ 764 
Otsu Otsu~ 695,764,774 
reflectance and 反射 和 ~ 762-763 
segmentation and ”分割 和 ~ 760-785 
smoothing in ”~ 中 的 平滑 769 
soft 软 ~ 530 
variable ”~ 变量 760,778-785 
Tie (control) points ”约束 (控制 ) 点 112 
TIFF 一 种 图 像 压缩 格式 ”560, 563, 573 
Tight frame HEA 501 
Tiling images WPR 46, 523 
Time-frequency tiles (or plane) 时间- 频率 片 (或 平面 ) 522-523 
Tokens 标记 582 
Top-hat transformation ” 顶 帽 变换 694-696 
Top-hat by reconstruction ”项 帽 重建 ”699 
Topological descriptors ”拓扑 描绘 子 845-849 
Transformation 变换 109-114, 126-220, 662-663, 694-696 
Affine 仿 射 ~ 109-111 
bottom-hat JEI ~ 694-696 
domains in ”~ 中 的 域 126 
geometric (rubber-sheet) ”几何 (橡皮 膜 ) ~ 见 Geometric 


transformations | 

gray-scale morphology and” 灰 度 级 形态 学 和 ~ 694-696 

hit-or-miss ” 击 中 或 击 不 中 ~ 662-663 

intensity 灰 度 ~ 126-220 

kernels ~ 核 117 

morphological image processing and ”形态 学 图 像 处 理 和 -~ 

662-663 

rubber sheet 橡皮 膜 ~ 109, 845 

spatial 空间 ~ 107, 127-193 

top-hat Mi ~ 694-696 

top-hat by reconstruction MIRE 699 
Transforms 变换 115-118, 126, 388, 390-395, 496-499, 508-515, 

523-532, 588-606 

block transform coding KEMA ~ 588-606 

discrete cosine ”离散 余弦 ~ 591 

domainsin ~'PÉ9 115-116, 126 

discrete cosine ”离散 余弦 ~ 118, 561,591 

discrete Karhunen-Loeve 离散 Karhunen-Loeve~ 867 

Fourier E~ 见 Fourier transform 

Haar 哈 尔 ~ 118, 496-499 

Hotelling 堆 特 林 ~ 867-874 

Hough #2%~ 见 Hough transform 

image (2-D linear) ”~ 图 像 ( 二 维 线性 ) 115-118 

morphological 形态 学 ~ |, Morphological image processing 

par ~ 对 116 

principal components ” 主 成 分 ~ 864-874 

Radon 雷 登 ~ 388, 390-395 

selection of for block transform 为 块 变 换 选取 的 ~ 

coding ~ 编码 589-595 

slant #}~ 118 

Walsh-Hadamard 沃 尔 什 -哈达 玛 ~ 118, 590 

wavelet 小 波 ~ 508-515,523-532 见 Wavelets 
Transmission electron microscope (TEM) ”发 射电 子 显 微 镜 45 
Trichromatic coefficients ”三 色 系 数 421 


U 
Ultra large scale integration(ULSD ”超大 规模 集成 ”27 
Ultrasound imaging ”超声波 成 像 42, 68, 390, 410 
Ultraviolet 紫外线 29, 33, 59, 66, 67 
Unary codes 一 元 编码 566 
Unbiased estimate ”无 偏 估计 163 
Uniform 均匀 Jil Noise 
Unit delays ”单位 延迟 488-489 
Unit discrete impulse ”单位 离散 冲 激 ” 见 Impulse 
Unitimpulse 单位 冲 激 ” 见 Impulse 
Units of measurement 单位 度量 66,67, 80-82 
bits for image storage 图像 存储 的 比特 80-82 
electromagnetic (EM) spectrum 电磁 波谱 66,67 
intensity resolution {KEIER 81-82 
spatial resolution ”空间 分 辩 率 81 
Unsharp masking “ 非 锐 化 模板 ”184-187,310-311 
Upsampling 上 采 ( 取 ) 样 486-487 


V 
Variable thresholding FJ (i (Eb It Thresholding 
Variable-length code ” 变 长 编码 551, 564-566 
Variance of intensity ” 灰 度 的 方差 VL Moments 
VC-1 compression VC-1 压缩 560, 563, 616 
Vector operations HERE 114-115, 172-173, 446-448 
full-color image processing ”全 彩色 图 像 处 理 ~ 446-448 
matrix operations and 和 矩阵 操作 和 ~ 114-115 
spatial filtering ”空间 滤波 ~ 172-173 
Very large scale integration (VLSI) ”甚大 规模 集成 电路 27 
Visible band of the EM spectrum 电磁 波谱 的 可 见 波段 34-40, 66-67 
Visible watermarks ”可 见 水 印 637. 
Vision 视觉 见 Visual perception 
human 人 类 ~ 58-65, 418, 740, 800 
machine 机 器 ~ 24-25, 28,928 


Visual perception ”视觉 感知 58-65, 417-423 


absorption of light 光 的 吸收 418-419 

brightness adaptation ”亮度 适应 61-65 

color image processing and 彩色 图 像 处 理 和 ~ 417-423 
discrimination between changes ”变化 间 的 分 辨 ~ 58-65r 
human eye physical structure 人 了 眼 的 自然 结构 58-60 
image formation in eye 眼中 的 图 像 形成 ”60-61 

Mach bands ”马赫 带 63,64 

optical illusions ”错觉 64-65 

simultaneous contrast ”同时 对 比 63-64 

subjective brightness ”主观 亮度 61-62 

Weber ratio 韦伯 比 62-63 


引 633 


separable2D ”可 分 二 维 ~ 524 
time-frequency characteristics ”~ 的 时 间 - 频 率 特性 522-523 
Wavelet vectors ”小 波 向 量 506 
Wavelet packets 小 波 包 532-541 
binary tree representation ”~ 的 二 叉 树 表示 532-540 
cost functions for choosing 选择 ~ 的 代价 函数 537-540 
subspace analysis tree ~ 的 子 空间 分 析 树 ”533 
Wavelets 小 波 49, 483-546 
compression ”~ 压缩 626-629 
continuous wavelet transform (CWT) ”连续 小 波 变 换 513-515 
discrete wavelet transform (DWT) ”高 散 小 波 变换 510-512, 524 
edge detection ”边缘 检测 529-530 
fast wavelet transform (FWT) ”快速 小 波 变 换 515-523, 524- 


527, 532-541 
Walsh-Hadamard transform (WHT) ” 活 尔 什 -哈达 玛 变 换 590-591 functions ~ 函数 505-508 
Watermarking digital images ”水 印 数字 图 像 636—643 JPEG-2000 一 种 压缩 格式 ”629-635 
block diagram for ”~ 的 方 框图 639 Mexican hat 墨西哥 草帽 ~ 514-515 
reasons for ~ 的 原因 636 multiresolution processing and ”多 分 辨 率 处 理 483-546 
Watermarks 水 印 636-643 noise removal 噪声 消除 530-532 
attacks on ”对 ~ 的 攻击 642-643 one-dimensional transforms ”一 维 - 变换 508-515 
fragile invisible 脆弱 不 可 见 ~ 639 packets ~f 532-541 
insertion and extraction ”~ 插入 和 提取 637—638, 640-642 series expansions ”~ 级 数 展开 508-510 
invisible watermark 不 可 见 ~ 638 transforms ”~ 变换 508-515, 523-532 
private (or restricted key) ” 私 钥 (或 受 限 密 钥 ) ~ 639 two-dimensional transforms ~ 二 维 变换 523-532 
public (or unrestricted key) ZMA (或 不 受 限 密 钥 ) ~ 639 Weber ratio HAH 62-63 
robust invisible HERTIL ~ 639 Weighting function JMX 363 
visible watermark 可 见 ~ 637 White noise ARF JL Noise 
Watersheds (morphological) 分水岭 (形态 学 ) ~ 791-800 Wiener filtering 维 纳 滤 波 374-379 
algorithm for ~ 算法 796-798 WMV9 compression WMV9 FE4i 560,563, 616 
dam construction for ~ 水坝 构建 ”794-796 
knowledge incorporation in ~ 中 的 知识 合并 791 X 
markers used for ~ 使 用 的 标记 “798-800 X-rays X 射 线 31,137,179,311,346, 384, 385, 387, 439, 442, 668, 
segmentation using 使 用 ~ 的 分 割 791-800 689, 693, 719, 753, 786, 790 
Wavelet coding 小波 编码 626-636 
decomposition level selection ~ 的 分 解 级 数 选取 628-629 Z 
JPEG-2000 compression JPEG-2000 JE% 629-636 Zero crossing property ” 零 交叉 特性 182,725, 736-739 
quantizer design for ~ 的 量化 器 设计 629 Zero-memory source 零 记 忆 信 源 554 
selection of wavelets for 小 波 的 选取 626-628 Zero-phase-shift fitters” 零 相 移 滤 波 器 284,316 
Wavelet functions “小波 函数 ”505 Zonal coding implementation ”区 域 编码 实现 598-599 
coefficients of ”~ 的 系数 506 Zooming 缩放 VL Image zooming 


Haar 哈 尔 ~ 506-507 


